A sequenciação é importante — mas a interpretação é muito mais importante (e muito mais difícil). Um aspeto frequentemente ignorado na interpretação é que o genoma de referência com o qual os seus dados são comparados pode, na verdade, não corresponder ao seu. E essa discrepância? Há décadas que vem distorcendo discretamente os resultados em genómica, epigenómica, transcriptómica e edição genética baseada em CRISPR.
Um novo artigo publicado na revista *Nature Communications*, em coautoria entre o Dante Labs e o Laboratório Giunta da Universidade Sapienza de Roma, acaba de demonstrar a solução — e os ganhos em termos de precisão são impressionantes.
O artigo: «Uma referência compatível com a linha celular permite uma genómica funcional de alta precisão» (Corda, Volpe, Dallali et al., Nature Communications, 2025)
Conclusão principal: A correspondência das suas leituras de sequenciação com um genoma de referência específico para a sua linha celular proporciona uma qualidade de mapeamento substancialmente melhor, elimina sinais falsos de expressão genética, identifica a localização exata do cinetocoro em cada cromossoma humano — e torna o desenho do ARN guia CRISPR ordens de magnitude mais fiável.
Esta é a base da genómica verdadeiramente personalizada. E já está aqui.
O problema: uma única referência para reger tudo (de forma inadequada)
O genoma de referência humano padrão — o hg38, ou o mais recente CHM13 — é uma conquista científica incrível. Mas trata-se, essencialmente, de uma média composta, construída a partir do ADN de dadores específicos. Quando se obtêm sequências das suas células (ou de qualquer linha celular específica) e se mapeiam em relação a essa referência genérica, está-se a obrigar um instrumento de precisão a utilizar um modelo aproximado.
A maior parte do genoma é mapeada com precisão. No entanto, as regiões mais críticas do ponto de vista biológico — especialmente os centrômeros, as estruturas cromossómicas que regulam a forma como o ADN é distribuído sempre que uma célula se divide — evoluem tão rapidamente e apresentam uma variabilidade tão grande que uma referência inadequada provoca erros reais e mensuráveis:
- As sequências não conseguem ser mapeadas em loci divergentes, criando pontos cegos na cobertura
- Nos dados de RNA-seq, surgem sinais falsos de expressão diferencial — os genes parecem estar ativos ou silenciados quando, na realidade, não estão
- Os ARNs-guia CRISPR concebidos com base numa referência errada falham o alvo, atingem o haplótipo errado ou apresentam um desempenho inferior in vivo
- As marcas epigenéticas nos centrômeros tornam-se indetectáveis, ocultando o local real da montagem do cinetocoro
Há anos que se sabe da existência do «viés de referência» neste domínio. Este artigo quantifica-o de forma rigorosa — e apresenta a solução.
A Solução: Mapeamento Isogenómico
A equipa de investigação introduziu um novo paradigma denominado «mapeamento isogenómico» — o alinhamento de sequências de leitura com um genoma de referência que corresponde especificamente à mesma linha celular de onde as sequências de leitura provêm.
Para comprovar isso, utilizaram o RPE1v1.1: um genoma de referência diploide recém-montado, quase completo e totalmente faseado para a RPE-1, uma das linhas celulares humanas mais utilizadas na investigação. Trata-se do primeiro genoma de qualidade «telómero a telómero» (T2T) construído para uma linha celular humana que pode ser trabalhada experimentalmente.
Em seguida, analisaram os dados — abrangendo sequenciação de ADN, sequenciação de ARN, conceção de guias CRISPR e perfis epigenéticos — comparando genomas de referência correspondentes com genomas de referência não correspondentes.
Os resultados são gritantes.
O que mudou quando acertaram no mapa
🎯 Mapeamento do ADN: Sinal significativamente mais nítido
Nas regiões de alta divergência (HDRs) — as partes do genoma onde os genomas individuais apresentam maiores diferenças — os índices de qualidade do mapeamento aumentaram significativamente e as distâncias de edição diminuíram quando as sequências foram alinhadas à referência correspondente. A cobertura tornou-se uniforme. O ruído diminuiu drasticamente. Os dados que anteriormente pareciam pouco fiáveis tornaram-se interpretáveis.
Isto é importante para quem realiza o sequenciamento do genoma completo com o objetivo de identificar variantes reais, em vez de artefactos de referência.
🧬 RNA-seq: 26 genes fantasmas, eliminados
As mesmas sequências de RNA-seq, alinhadas a três genomas de referência diferentes, revelaram 26 genes que pareciam estar expressos de forma diferenciada apenas devido à escolha da referência — e não por motivos biológicos. Não houve qualquer alteração biológica real. Apenas ruído da referência confundido com sinal.
Para os biohackers que monitorizam alterações na expressão genética em resposta a diversas intervenções — dieta, suplementos, jejum, exposição ao calor ou ao frio —, isto é um sinal de alerta. Se a sua sequenciação de RNA for mapeada para uma referência errada, parte do que parece ser uma resposta pode, na verdade, ser um artefacto.
O mapeamento isogenómico elimina completamente este tipo de erro.
✂️ CRISPR: O genoma de referência que escolhe para a sua edição determina se esta funciona
É aqui que a questão se torna especialmente relevante para quem trabalha na área da edição genética — e onde os números se tornam alarmantes.
A equipa testou 76 ARNs-guia CRISPR específicos para cromossomas, concebidos com base no genoma de referência CHM13, comparando-os com o genoma real da linha celular RPE-1. As conclusões:
- 4% dos guias não apresentavam locais de ligação no RPE-1 — são completamente inoperantes nesta linha celular, apesar de terem sido totalmente validados numa referência diferente. Se realizasse a sua experiência, nada aconteceria.
- Algumas guias apresentaram índices de especificidade cromossómica superiores a 0,89 no CHM13 — mas inferiores a 0,10 no RPE-1. Trata-se de uma redução de 9 a 10 vezes na especificidade: uma guia concebida para cortar um cromossoma específico torna-se quase inespecífica no modelo experimental real. Na prática, isso significa cortes fora do alvo não intencionais em vários cromossomas.
- Vários marcadores do cromossoma 21 revelaram mais de quatro vezes mais locais de ligação num haplótipo do que no outro — o que significa que, mesmo dentro da mesma célula, uma cópia de um cromossoma é editada de forma muito mais agressiva do que a outra.
Os centrômeros estão entre as regiões mais variáveis entre dois genomas quaisquer. Conceber guias CRISPR com base numa referência incompatível é como programar um robô cirúrgico utilizando imagens de um paciente diferente. Tecnicamente válido. Na prática, perigoso.
O mapeamento isogenómico colmata essa lacuna. Uma melhoria de 9 a 10 vezes na especificidade cromossómica não é meramente incremental — é a diferença entre uma edição precisa e uma edição dispersa.
🗺️ Epigenómica: O cinetocoro, finalmente desvendado
O resultado mais marcante: quando a equipa mapeou a CENP-A (a variante da histona que marca o núcleo funcional do centrómero) utilizando leituras isogenómicas, conseguiu determinar — pela primeira vez — a localização exata do cinetocoro em cada cromossoma, em ambos os haplótipos.
Todos os outros genomas de referência testados — hg38, CHM13, HG002, T2T-YAO — não conseguiram produzir um sinal claro e de elevada fiabilidade de CENP-A nos centrômeros. Apenas o genoma de referência correspondente revelou o sinal.
Isto é extremamente importante para compreender os erros de segregação cromossómica, que estão na origem da aneuploidia, do cancro e de doenças do desenvolvimento. Pela primeira vez, dispomos de um mapa com resolução de haplótipos que indica onde o cinetocoro se forma efetivamente — numa linha celular real e utilizável em experiências.
Conclusão do Biohacker: A genómica personalizada requer uma referência personalizada
A era da genómica de precisão sempre prometeu uma medicina e uma biologia adaptadas a cada indivíduo. Mas se o passo fundamental — a leitura do genoma — for realizado com base num modelo impreciso, todas as conclusões posteriores herdam esse erro.
O quadro isogenómico é a peça que faltava. Eis o que isso significa na prática:
| O que estás a fazer | O que muda com o mapeamento isogenómico |
|---|---|
| Sequenciação do genoma completo | Identificação mais precisa de variantes, especialmente nos centrômeros e noutras regiões divergentes |
| Sequenciação de ARN / transcriptómica | Eliminou falsos positivos de artefactos de referência na expressão genética |
| Conceção de guias CRISPR | Guias validados com base na sua sequência genómica real — e não numa sequência de referência |
| Perfil epigenético | Identifica os estados da cromatina em loci complexos e repetitivos que antes eram invisíveis |
| Investigação em medicina de precisão | Uma base para intervenções específicas para cada haplótipo |
A equipa de investigação apela a um esforço sistemático para construir genomas diploides T2T para todas as principais linhas celulares experimentais. À medida que essa biblioteca cresce — iPSCs, ESCs, linhas celulares primárias —, aumenta também a capacidade de realizar uma genómica funcional verdadeiramente personalizada.
A Dante Labs está a construir esse futuro
Na Dante Labs, contribuir para esta investigação é uma expressão direta da nossa missão principal: tornar acessível a verdade genómica em alta resolução. Participámos na geração e validação dos dados de sequenciação que tornaram possível a montagem do RPE1v1.1 e estas descobertas.
À medida que mais genomas de referência específicos para cada linha celular são disponibilizados online, estamos em posição de ajudar investigadores, médicos e biohackers a tirar partido deles — porque um genoma descodificado com precisão é um genoma sobre o qual se pode realmente agir.
Leia o artigo
«Uma referência compatível com a linha celular permite uma genómica funcional de alta precisão»
Corda, Volpe, Dallali, Di Tommaso, Colantoni, Guarracino, Chittoor, Capulli, Tassone, Giunta et al.
Nature Communications, vol. 16, artigo 11194 — Publicado a 20 de novembro de 2025
→ Leia o artigo completo em Nature.com
A Dante Labs é líder mundial em sequenciação do genoma completo e análise multi-ómica. Sequencie o seu genoma →
Receba novas publicações da Dante Labs
Informações sobre genómica, novidades sobre produtos e perspetivas clínicas — diretamente na sua caixa de entrada.