Sekvenování je důležité – ale interpretace je mnohem důležitější (a mnohem složitější). Často opomíjeným aspektem interpretace je skutečnost, že referenční genom, s nímž se vaše data porovnávají, nemusí ve skutečnosti odpovídat vašemu genomu. A ten rozdíl? Ten už po celá desetiletí nenápadně zkresluje výsledky v oblastech genomiky, epigenomiky, transkriptomiky i úpravy genů pomocí technologie CRISPR.
Nový článek v časopise Nature Communications, na jehož vzniku se podílely laboratoře Dante Labs a Giunta Lab při Římské univerzitě Sapienza, právě představil řešení – a nárůst přesnosti je skutečně dramatický.
Článek: „Referenční genom přizpůsobený buněčné linii umožňuje vysoce přesnou funkční genomiku“ (Corda, Volpe, Dallali et al., Nature Communications, 2025)
Hlavní zjištění: Porovnání sekvenačních dat s referenčním genomem specifickým pro danou buněčnou linii přináší podstatně lepší kvalitu mapování, eliminuje falešné signály genové exprese, identifikuje přesné umístění kinetochoru na každém lidském chromozomu – a činí návrh CRISPR guide RNA o řádově spolehlivějším.
To je základ skutečně personalizované genomiky. A už je to realita.
Problém: Jediný zdroj, který má (neúspěšně) vládnout všem
Standardní referenční lidský genom – hg38 nebo novější CHM13 – představuje neuvěřitelný vědecký úspěch. V podstatě se však jedná o složený průměr, sestavený z DNA konkrétních dárců. Když vezmete sekvenční údaje ze svých buněk (nebo z jakékoli konkrétní buněčné linie) a namapujete je na tuto obecnou referenci, nutíte přesný přístroj, aby používal pouze přibližnou šablonu.
Většina genomu se mapuje bez problémů. Avšak biologicky nejdůležitější oblasti – zejména centromery, tedy chromozomální struktury, které určují, jak se DNA rozdělí při každém buněčném dělení – se vyvíjejí tak rychle a vykazují tak velké individuální rozdíly, že nesprávná referenční sekvence způsobuje skutečné, měřitelné chyby:
- Čtení se na odlišných lokusech nepodaří přiřadit, což vede ke vzniku mezer v pokrytí
- V datech z sekvenování RNA se objevují falešné signály rozdílné exprese – geny vypadají jako aktivní nebo potlačené, i když tomu tak není
- CRISPR-vodicí RNA navržené na základě nesprávného referenčního vzorku minou svůj cíl, zasáhnou nesprávný haplotyp nebo vykazují v živém organismu nedostatečnou účinnost
- Epigenetické znaky v centromerech se stávají nerozlišitelnými, čímž zakrývají skutečné místo sestavení kinetochoru
V oboru se o „referenční zaujatosti“ ví už léta. Tato studie ji přesně kvantifikuje – a nabízí řešení.
Řešení: Izogenomické mapování
Výzkumný tým představil nový přístup nazvaný isogenomické mapování – přiřazování sekvenačních čtení k referenčnímu genomu, který je specificky přizpůsoben téže buněčné linii, z níž tato čtení pocházejí.
Aby to dokázali, použili RPE1v1.1: nově sestavený, téměř kompletní a plně fázovaný diploidní referenční genom pro RPE-1, jednu z nejčastěji používaných lidských buněčných linií ve výzkumu. Jedná se o první genom v kvalitě „telomer k telomeru“ (T2T), který byl sestaven pro experimentálně zpracovatelnou lidskou buněčnou linii.
Poté provedli analýzu dat – zahrnující sekvenování DNA, sekvenování RNA, návrh vodicích sekvencí CRISPR a epigenetické profilování – a porovnali shodné a neshodné referenční genomy.
Výsledky jsou alarmující.
Co se změnilo, když se jim podařilo správně vypracovat mapu
🎯 Mapování DNA: Výrazně čistší signál
V oblastech s vysokou diverzitou (HDR) – tedy v částech genomu, kde se jednotlivé genomy liší nejvíce – se skóre kvality mapování výrazně zvýšilo a vzdálenosti editace se snížily, když byly sekvence zarovnány s odpovídající referencí. Pokrytí se sjednotilo. Šum se výrazně snížil. Data, která dříve vypadala jako nespolehlivá, se stala interpretovatelnými.
To je důležité pro každého, kdo provádí sekvenování celého genomu s cílem najít skutečné varianty, nikoli artefakty vzniklé při porovnání s referenční sekvencí.
🧬 RNA-seq: 26 fiktivních genů, vyloučeno
Stejné sekvenční údaje z RNA-seq, které byly porovnány se třemi různými referenčními genomy, vykazovaly 26 genů s odlišnou expresí, a to výhradně kvůli volbě referenčního genomu – nikoli z biologických důvodů. Žádná skutečná biologická změna. Jednalo se pouze o šum v referenčním genomu, který byl mylně považován za signál.
Pro biohackery, kteří sledují změny v genové expresi v souvislosti s různými zásahy – jako je strava, doplňky stravy, půst nebo vystavení teplu či chladu –, je to varovný signál. Pokud je vaše sekvenování RNA namapováno na nesprávnou referenční sekvenci, může se část toho, co vypadá jako reakce, ve skutečnosti jednat o artefakt.
Isogenomické mapování tuto kategorii chyb zcela eliminuje.
✂️ CRISPR: Úspěch úpravy závisí na tom, jaký referenční genom si zvolíte
Právě v tomto bodě to začíná být obzvláště důležité pro všechny, kdo se zabývají úpravou genů – a právě zde se čísla stávají alarmujícími.
Tým otestoval 76 chromozomově specifických CRISPR-vodicích RNA, které byly navrženy na základě referenčního genomu CHM13, a porovnal je se skutečným genomem buněčné linie RPE-1. Zjištění:
- U 4 % průvodců nebyly v RPE-1 zjištěny žádné vazebné místa – v této buněčné linii jsou zcela nefunkční, přestože byly na jiné referenční linii plně ověřeny. Provedli byste experiment a nic by se nestalo.
- Některé vodicí sekvence vykazovaly na chromozomu CHM13 skóre chromozomální specificity vyšší než 0,89, avšak na chromozomu RPE-1 nižší než 0,10. Jedná se o 9–10násobný pokles specificity: vodicí sekvence navržená k řezání jednoho konkrétního chromozomu se v reálném experimentálním modelu stává téměř nespecifickou. V praxi to znamená nechtěné řezání mimo cíl na více chromozomech.
- Několik vodítek pro chromozom 21 vykazovalo na jednom haplotypu více než čtyřikrát více vazebných míst než na druhém – což znamená, že i v rámci jedné buňky dochází k úpravám jedné kopie chromozomu mnohem intenzivněji než u té druhé.
Centromery patří mezi oblasti, které se mezi libovolnými dvěma genomy liší nejvíce. Navrhovat CRISPR-vodiče na základě nesprávné referenční sekvence je jako programovat chirurgického robota na základě snímků jiného pacienta. Technicky je to možné, ale v praxi je to nebezpečné.
Isogenomické mapování tuto mezeru vyplňuje. Zlepšení chromozomové specificity o faktor 9–10 není jen nepatrným pokrokem – jde o rozdíl mezi přesnou a nepřesnou úpravou.
🗺️ Epigenomika: Kinetochor – konečně objasněn
Nejvýraznější výsledek: když tým zmapoval CENP-A (variantu histonu, která označuje funkční jádro centromery) pomocí izogenomických sekvencí, podařilo se mu poprvé určit přesnou polohu kinetochoru na každém chromozomu u obou haplotypů.
Žádný z ostatních testovaných referenčních genomů – hg38, CHM13, HG002, T2T-YAO – nedokázal v centromerech vygenerovat jasný signál CENP-A s vysokou mírou spolehlivosti. Pouze odpovídající referenční genom tento signál odhalil.
To má obrovský význam pro pochopení chyb při segregaci chromozomů, které jsou příčinou aneuploidie, rakoviny a vývojových poruch. Poprvé máme k dispozici mapu s rozlišením na úrovni haplotypů, která ukazuje, kde se kinetochor skutečně tvoří – a to v reálné, experimentálně využitelné buněčné linii.
Závěr pro biohackery: Personalizovaná genomika vyžaduje personalizovaný referenční rámec
Éra přesné genomiky vždy slibovala medicínu a biologii přizpůsobenou konkrétnímu jedinci. Pokud se však základní krok – sekvenování genomu – provádí na základě nepřesné šablony, přenese se tato chyba i na všechny následné poznatky.
Isogenomický rámec je tím chybějícím článkem. V praxi to znamená následující:
| Co právě děláte | Co se mění díky izogenomickému mapování |
|---|---|
| Sekvenování celého genomu | Čistší varianty volání, zejména v oblasti centromer a dalších divergentních oblastí |
| RNA-seq / transkriptomika | Byly odstraněny falešně pozitivní výsledky způsobené referenčními artefakty v analýze genové exprese |
| Návrh vodicího nukleotidu pro CRISPR | Průvodce ověřené na základě vaší skutečné genomové sekvence – nikoli na základě náhradního vzorku |
| Epigenetické profilování | Rozlišuje stavy chromatinu na složitých, repetitivních lokusech, které byly dosud neviditelné |
| Výzkum v oblasti přesné medicíny | Základ pro intervence zaměřené na konkrétní haplotypy |
Výzkumný tým vyzývá k systematickému úsilí o vytvoření diploidních genomů T2T pro všechny hlavní experimentální buněčné linie. S rozšiřováním této knihovny – iPSC, ESC, primární buněčné linie – roste i schopnost provádět skutečně personalizovanou funkční genomiku.
Společnost Dante Labs tuto budoucnost buduje
Pro společnost Dante Labs je podíl na tomto výzkumu přímým vyjádřením našeho hlavního poslání: zpřístupňovat přesné genomické informace ve vysokém rozlišení. Podíleli jsme se na získávání a ověřování sekvenačních dat, díky nimž vznikla sekvence RPE1v1.1 a které umožnily tyto objevy.
S tím, jak se na internetu objevuje stále více referenčních genomů specifických pro jednotlivé buněčné linie, jsme připraveni pomoci výzkumníkům, klinickým lékařům i biohackerům tyto zdroje využít – protože pouze přesně zmapovaný genom je genomem, na jehož základě lze skutečně jednat.
Přečtěte si článek
„Referenční sekvence shodná s buněčnou linií umožňuje vysoce přesnou funkční genomiku“
Corda, Volpe, Dallali, Di Tommaso, Colantoni, Guarracino, Chittoor, Capulli, Tassone, Giunta a kol.
Nature Communications, sv. 16, článek 11194 — publikováno 20. listopadu 2025
→ Přečtěte si celý článek na Nature.com
Společnost Dante Labs je světovým lídrem v oblasti sekvenování celého genomu a multiomické analýzy. Nechte si sekvenovat svůj genom →
Sledujte nové příspěvky od Dante Labs
Informace z oblasti genomiky, novinky o produktech a klinické pohledy – přímo do vaší e-mailové schránky.