Le séquençage est important, mais l'interprétation l'est bien davantage (et s'avère bien plus difficile). Un aspect souvent négligé de l'interprétation est que le génome de référence auquel vos données sont comparées pourrait ne pas correspondre exactement au vôtre. Et cet écart ? Il fausse discrètement les résultats en génomique, en épigénomique, en transcriptomique et dans l'édition génétique par CRISPR depuis des décennies.
Un nouvel article publié dans *Nature Communications*, rédigé conjointement par Dante Labs et le laboratoire Giunta de l'université Sapienza de Rome, vient d'en apporter la preuve — et les gains en termes de précision sont spectaculaires.
L'article : « Une référence adaptée à la lignée cellulaire permet une génomique fonctionnelle de haute précision » (Corda, Volpe, Dallali et al., Nature Communications, 2025)
Principale conclusion : l'appariement de vos lectures de séquençage à un génome de référence spécifique à votre lignée cellulaire offre une qualité de mappage nettement supérieure, élimine les faux signaux d'expression génique, identifie l'emplacement exact du kinétochore sur chaque chromosome humain — et rend la conception de l'ARN guide CRISPR bien plus fiable.
C'est là le fondement d'une génomique véritablement personnalisée. Et c'est déjà une réalité.
Le problème : une seule référence pour toutes (et de mauvaise qualité)
Le génome humain de référence standard — hg38, ou le plus récent CHM13 — constitue une incroyable prouesse scientifique. Mais il s'agit essentiellement d'une moyenne composite, élaborée à partir de l'ADN de donneurs spécifiques. Lorsque vous prenez des séquences issues de vos propres cellules (ou de n'importe quelle lignée cellulaire spécifique) et que vous les alignez sur cette référence générique, vous imposez à un instrument de précision d'utiliser un modèle approximatif.
La majeure partie du génome est cartographiée avec précision. Mais les régions les plus cruciales sur le plan biologique — en particulier les centromères, ces structures chromosomiques qui régissent la manière dont l'ADN est réparti à chaque division cellulaire — évoluent si rapidement et présentent une telle variabilité individuelle qu'une référence inadaptée entraîne des erreurs réelles et mesurables :
- Les séquences ne parviennent pas à s'aligner sur certains loci, ce qui crée des zones non couvertes
- Des signaux d'expression différentielle erronés apparaissent dans les données de séquençage d'ARN : certains gènes semblent actifs ou inactivés alors qu'ils ne le sont pas
- Les ARN guides CRISPR conçus à partir d'une référence erronée manquent leur cible, agissent sur un haplotype incorrect ou présentent des performances insuffisantes in vivo
- Les marques épigénétiques au niveau des centromères deviennent indétectables, masquant ainsi le site réel d'assemblage du kinétochore
Le milieu connaît depuis des années le phénomène du « biais de référence ». Cet article le quantifie de manière rigoureuse — et propose une solution.
La solution : la cartographie isogénomique
L'équipe de recherche a introduit un nouveau paradigme appelé « cartographie isogénomique » : il s'agit d'aligner les séquences de séquençage sur un génome de référence spécifiquement adapté à la lignée cellulaire dont proviennent ces séquences.
Pour le démontrer, ils ont utilisé RPE1v1.1: un génome de référence diploïde récemment assemblé, quasi complet et entièrement phasé pour la lignée RPE-1, l'une des lignées cellulaires humaines les plus couramment utilisées en recherche. Il s'agit du premier génome de qualité « télomère à télomère » (T2T) construit pour une lignée cellulaire humaine pouvant faire l'objet d'expérimentations.
Ils ont ensuite analysé les données — issues du séquençage de l'ADN, du séquençage de l'ARN, de la conception de guides CRISPR et du profilage épigénétique — en comparant les génomes de référence appariés à ceux non appariés.
Les résultats sont sans appel.
Qu'est-ce qui a changé quand ils ont corrigé la carte ?
🎯 Cartographie de l'ADN : un signal nettement plus clair
Dans les régions à forte divergence (HDR) — ces parties du génome où les génomes individuels présentent les différences les plus marquées —, les scores de qualité du mappage ont considérablement augmenté et les distances d'édition ont diminué lorsque les séquences ont été alignées sur la référence correspondante. La couverture est devenue uniforme. Le bruit s'est atténué. Des données qui semblaient auparavant peu fiables sont devenues interprétables.
Cela est important pour toute personne qui effectue un séquençage du génome entier dans le but de détecter de véritables variants plutôt que des artefacts liés à la séquence de référence.
🧬 Séquençage d'ARN : 26 gènes fantômes éliminés
Les mêmes séquences d'ARN, alignées sur trois génomes de référence différents, ont mis en évidence 26 gènes qui semblaient présenter une expression différentielle uniquement en raison du choix de la référence — et non pour des raisons biologiques. Aucun changement biologique réel. Il s'agit simplement d'un bruit de référence pris pour un signal.
Pour les biohackers qui suivent les variations de l'expression génétique en fonction de différentes interventions — régime alimentaire, compléments alimentaires, jeûne, exposition à la chaleur ou au froid —, c'est un signal d'alarme. Si votre séquençage d'ARN est aligné sur une référence erronée, ce qui semble être une réponse pourrait en réalité n'être qu'un artefact.
La cartographie isogénomique élimine complètement ce type d'erreur.
✂️ CRISPR : c'est le génome de référence sur lequel vous effectuez votre édition qui détermine si celle-ci fonctionne
C'est là que cela revêt une importance particulière pour tous ceux qui travaillent dans le domaine de l'édition génétique — et que les chiffres deviennent alarmants.
L'équipe a testé 76 ARN guides CRISPR spécifiques à certains chromosomes, conçus à partir du génome de référence CHM13, sur le génome réel de la lignée cellulaire RPE-1. Les résultats :
- 4 % des guides ne présentaient aucun site de liaison sur RPE-1 — ils sont totalement inactifs dans cette lignée cellulaire, bien qu'ils aient été pleinement validés sur une autre lignée de référence. Si vous meniez votre expérience, il ne se passerait rien.
- Certains guides présentaient des scores de spécificité chromosomique supérieurs à 0,89 sur le chromosome 13, mais inférieurs à 0,10 sur le chromosome RPE-1. Cela représente une chute de 9 à 10 fois de la spécificité: un guide conçu pour couper un chromosome spécifique devient pratiquement non spécifique dans le modèle expérimental réel. En pratique, cela se traduit par des coupures hors cible involontaires sur plusieurs chromosomes.
- Plusieurs guides ciblant le chromosome 21 ont révélé plus de quatre fois plus de sites de liaison sur un haplotype que sur l'autre, ce qui signifie que, même au sein d'une même cellule, une copie d'un chromosome est modifiée de manière bien plus intensive que l'autre.
Les centromères comptent parmi les régions les plus variables entre deux génomes quelconques. Concevoir des guides CRISPR à partir d'une référence non correspondante revient à programmer un robot chirurgical en utilisant les images d'un autre patient. Techniquement valable. Pratiquement dangereux.
La cartographie isogénomique comble cette lacune. Une amélioration de 9 à 10 fois supérieure de la spécificité chromosomique n'est pas simplement une amélioration progressive : c'est la différence entre une modification précise et une modification aléatoire.
🗺️ Épigénomique : le kinétochore, enfin élucidé
Le résultat le plus marquant : lorsque l'équipe a cartographié le gène CENP-A (la variante d'histone qui marque le cœur fonctionnel du centromère) à l'aide de lectures isogénomiques, elle a pu déterminer, pour la première fois, l'emplacement exact du kinétochore sur chaque chromosome, pour les deux haplotypes.
Tous les autres génomes de référence testés — hg38, CHM13, HG002, T2T-YAO — n'ont pas permis d'obtenir un signal CENP-A clair et fiable au niveau des centromères. Seul le génome de référence correspondant a permis de mettre en évidence ce signal.
Cela revêt une importance capitale pour comprendre les erreurs de ségrégation chromosomique, qui sont à l'origine de l'aneuploïdie, du cancer et des troubles du développement. Pour la première fois, nous disposons d'une carte haplotypique précisant l'emplacement exact où se forme le kinétochore, et ce dans une lignée cellulaire réelle et exploitable à des fins expérimentales.
Conclusion pour les biohackers : la génomique personnalisée nécessite une référence personnalisée
L'ère de la génomique de précision a toujours promis une médecine et une biologie adaptées à chaque individu. Mais si l'étape fondamentale — la lecture de votre génome — est réalisée à partir d'un modèle imprécis, toutes les conclusions qui en découlent héritent de cette erreur.
Le cadre isogénomique est la pièce manquante du puzzle. Voici ce que cela signifie concrètement :
| Ce que tu fais | Quels sont les changements apportés par la cartographie isogénomique ? |
|---|---|
| Séquençage du génome complet | Des appels de variants plus précis, en particulier au niveau des centromères et d'autres régions divergentes |
| Séquençage d'ARN / transcriptomique | Élimination des faux positifs liés aux artefacts de référence dans l'expression génique |
| Conception de guides CRISPR | Des guides validés sur votre séquence génomique réelle — et non sur une séquence de référence |
| Profilage épigénétique | Permet de déterminer les états de la chromatine au niveau de loci complexes et répétitifs qui étaient auparavant invisibles |
| Recherche en médecine de précision | Une base pour des interventions ciblées sur des haplotypes spécifiques |
L'équipe de recherche préconise un effort systématique visant à établir des génomes diploïdes T2T pour toutes les principales lignées cellulaires expérimentales. À mesure que cette bibliothèque s'enrichit — cellules iPS, cellules souches embryonnaires, lignées cellulaires primaires —, la capacité à mener des recherches en génomique fonctionnelle véritablement personnalisées s'accroît également.
Dante Labs construit cet avenir
Chez Dante Labs, contribuer à ces recherches est l'expression directe de notre mission première : rendre accessible la vérité génomique en haute résolution. Nous avons participé à la production et à la validation des données de séquençage qui ont permis l'assemblage du RPE1v1.1 et ces découvertes.
À mesure que de nouveaux génomes de référence spécifiques à des lignées cellulaires sont mis en ligne, nous sommes en mesure d'aider les chercheurs, les cliniciens et les biohackers à en tirer parti — car un génome séquencé avec précision est un génome sur lequel on peut réellement agir.
Lire l'article
« Une référence adaptée à la lignée cellulaire permet une génomique fonctionnelle de haute précision »
Corda, Volpe, Dallali, Di Tommaso, Colantoni, Guarracino, Chittoor, Capulli, Tassone, Giunta et al.
Nature Communications, vol. 16, article 11194 — Publié le 20 novembre 2025
→ Lire l'article complet sur Nature.com
Dante Labs est un leader mondial dans le domaine du séquençage du génome entier et de l'analyse multi-omique. Séquencez votre génome →
Recevez les nouveaux articles de Dante Labs
Actualités sur la génomique, mises à jour sur nos produits et perspectives cliniques — directement dans votre boîte mail.