Sequenciamento: Sanger, NGS e long reads
TL;DR
Sanger lê uma região-alvo com alta acurácia por leitura e ainda é útil para validações pequenas. NGS sequencia milhões de fragmentos em paralelo e sustenta painéis, exomas, genomas, RNA-seq e ensaios single-cell. Long-read sequencing lê moléculas mais longas de DNA/RNA, ajudando em variantes estruturais, repetições, faseamento, isoformas e fluxos com metilação. Fontes: [1], [2], [3]
Comparação
| Método | Melhor para | Fraqueza |
|---|---|---|
| Sanger | locus único, plasmídeo, validação pequena | baixo throughput, ruim para misturas |
| Painel NGS | genes de câncer conhecidos, alta profundidade | pouca descoberta fora do painel |
| Exoma | mutações codificantes | perde não codificante e muitos eventos estruturais |
| Genoma completo | visão ampla de DNA | custo, armazenamento, interpretação |
| RNA-seq | expressão, fusões, splicing | qualidade do RNA e viés de expressão |
| Long-read | SVs, repetições, faseamento, isoformas | custo, qualidade de input, perfil de erro por plataforma |
O que produz
| Etapa de bancada | Objeto de dado |
|---|---|
| extração | concentração, pureza, integridade |
| preparo de biblioteca | tamanho de inserto, adaptadores, índices |
| sequenciamento | FASTQ e scores de qualidade |
| alinhamento | BAM/CRAM |
| chamada de variantes | VCF/BCF |
| expressão | matriz de contagens, TPM, expressão diferencial |
Falhas comuns
- DNA/RNA degradado
- baixa pureza tumoral
- artefatos de formol
- index hopping ou troca de amostra
- profundidade insuficiente para baixa fração alélica
- viés de captura
- duplicatas PCR
- alinhamento ruim em regiões repetitivas
- superinterpretação sem evidência ortogonal
Notas para desenvolvedores
- FASTQ não é "a sequência"; é leitura mais score de qualidade.
- BAM/CRAM depende de genoma de referência, alinhador, parâmetros e pré-processamento.
- Registros VCF são hipóteses após filtragem, não verdade bruta.
- Sequenciamento tumor-only exige cuidado porque germinativo e somático podem se confundir.
- Chamadas long-read e short-read não devem ser fundidas às cegas; os perfis de erro diferem.
- Toda tabela de variantes deve preservar amostra, ensaio, build genômico, caller, filtros e profundidade.
Veja também
Referências
- Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A 1977;74:5463-5467. https://doi.org/10.1073/pnas.74.12.5463
- Behjati S, Tarpey PS. What is next generation sequencing? Arch Dis Child Educ Pract Ed 2013;98:236-238. PMID 23986538. https://doi.org/10.1136/archdischild-2013-304340
- Si HQ, Wang P, Long F, et al. Cancer liquid biopsies by Oxford Nanopore Technologies sequencing of cell-free DNA. Mol Cancer 2024;23:265. PMID 39614371. https://doi.org/10.1186/s12943-024-02178-6