Sekvensering är viktigt – men tolkningen är betydligt viktigare (och mycket svårare). En aspekt av tolkningen som ofta förbises är att det referensgenom som dina data jämförs med kanske inte alls stämmer överens med dig. Och den här avvikelsen? Den har i tysthet snedvridit resultaten inom genomik, epigenomik, transkriptomik och CRISPR-baserad genredigering i årtionden.
En ny artikel i Nature Communications, författad gemensamt av Dante Labs och Giunta Lab vid Sapienza-universitetet i Rom, har just visat på lösningen – och precisionen har förbättrats avsevärt.
Artikeln: ”Cell line-matched reference enables high-precision functional genomics” (Corda, Volpe, Dallali m.fl., Nature Communications, 2025)
Det viktigaste resultatet: Att matcha sekvenseringsresultaten mot ett referensgenom som är specifikt för din cellinje ger väsentligt bättre kartläggningskvalitet, eliminerar falska genuttryckssignaler, identifierar den exakta kinetokorplatsen på varje mänsklig kromosom – och gör utformningen av CRISPR-guide-RNA betydligt mer tillförlitlig.
Detta är grunden för en verkligt individanpassad genomik. Och den finns här redan nu.
Problemet: En enda referens som ska styra allt (på ett dåligt sätt)
Det standardiserade referensgenomet för människan – hg38, eller det nyare CHM13 – är en otrolig vetenskaplig bedrift. Men det är i grunden ett sammansatt genomsnitt, skapat utifrån DNA från specifika donatorer. När man tar sekvenseringsdata från sina egna celler (eller en specifik cellinje) och jämför dem med den generiska referensen, tvingar man ett precisionsinstrument att använda en ungefärlig mall.
Större delen av genomet kartläggs utan problem. Men de biologiskt sett viktigaste områdena – särskilt centromererna, de kromosomstrukturer som styr hur DNA:t delas varje gång en cell delar sig – utvecklas så snabbt och varierar så mycket från individ till individ att en felaktig referens ger upphov till verkliga, mätbara fel:
- Avläsningarna misslyckas med att kartläggas vid avvikande loci, vilket skapar luckor i täckningen
- Falska signaler om differentierad genuttryck förekommer i RNA-sekvenseringsdata – gener framstår som aktiva eller tystade när de i själva verket inte är det
- CRISPR-guide-RNA som utformats utifrån fel referens missar sitt mål, träffar fel haplotyp eller fungerar sämre in vivo
- De epigenetiska markeringarna vid centromererna blir otydliga, vilket döljer den faktiska platsen för kinetokorbildningen
Inom branschen har man känt till ”referensbias” i åratal. Denna artikel kvantifierar fenomenet på ett noggrant sätt – och presenterar en lösning.
Lösningen: Isogenomisk kartläggning
Forskargruppen introducerade ett nytt tillvägagångssätt som kallas isogenomisk kartläggning – där sekvenseringsdata jämförs med ett referensgenom som är specifikt anpassat till samma cellinje som data härstammar från.
För att bevisa detta använde de RPE1v1.1: ett nyligen sammansatt, nästan komplett och fullständigt fasbestämt diploidt referensgenom för RPE-1, en av de mest använda mänskliga cellinjerna inom forskningen. Detta är det första genomet av telomertilltelomert (T2T)-kvalitet som har skapats för en mänsklig cellinje som är lämplig för experiment.
Sedan analyserade de data – från DNA-sekvensering, RNA-sekvensering, utformning av CRISPR-guider och epigenetisk profilering – och jämförde matchade referensgenom med icke-matchade.
Resultaten är nedslående.
Vad förändrades när de fick rätt på kartan
🎯 DNA-kartläggning: Avsevärt renare signal
I områden med stor variation (HDR) – de delar av genomet där de enskilda genomens skillnader är som störst – steg kartläggningskvalitetsvärdena markant och redigeringsavstånden minskade när sekvenserna jämfördes med den matchande referensen. Täckningen blev jämn. Bruset försvann. Data som tidigare verkade opålitliga blev tolkbara.
Detta är viktigt för alla som utför helgenomsekvensering i syfte att hitta verkliga varianter snarare än artefakter i referensgenomet.
🧬 RNA-sekvensering: 26 ”fantomgener” har eliminerats
Samma RNA-sekvensavläsningar, som jämförts med tre olika referensgenom, resulterade i 26 gener som verkade vara olika uttryckta enbart på grund av valet av referensgenom – inte på grund av biologiska faktorer. Ingen faktisk biologisk förändring. Bara referensbrus som misstagits för en signal.
För biohackare som följer förändringar i genuttrycket vid olika ingrepp – kost, kosttillskott, fasta, exponering för värme eller kyla – är detta en varningssignal. Om din RNA-sekvensering har kopplats till fel referens kan en del av det som ser ut som en reaktion i själva verket vara en artefakt.
Isogenomisk kartläggning eliminerar denna typ av fel helt och hållet.
✂️ CRISPR: Det referensgenom du utgår ifrån avgör om din redigering fungerar
Det är här det blir särskilt viktigt för alla som är verksamma inom genredigering – och där siffrorna börjar se alarmerande ut.
Forskargruppen testade 76 kromosomspecifika CRISPR-guide-RNA, som utformats utifrån CHM13-referensgenomet, mot det faktiska genomet hos RPE-1-cellinjen. Resultaten:
- 4 % av guiderna hade inga bindningsställen i RPE-1 – de är helt icke-funktionella i denna cellinje, trots att de har validerats fullständigt på en annan referens. Om du genomförde ditt experiment skulle ingenting hända.
- Vissa guider uppvisade kromosomspecifikitetsvärden över 0,89 på CHM13 – men under 0,10 på RPE-1. Det innebär en minskning av specificiteten med 9–10 gånger: en guide som är utformad för att klippa i en specifik kromosom blir i praktiken nästan ospecifik i den faktiska experimentmodellen. I praktiken innebär detta oavsiktliga snitt utanför målet på flera olika kromosomer.
- Flera kartor över kromosom 21 visade att det fanns mer än fyra gånger så många bindningsställen på den ena haplotypen jämfört med den andra – vilket innebär att även inom samma cell redigeras den ena kopian av kromosomen betydligt mer intensivt än den andra.
Centromererna hör till de områden som varierar mest mellan två valfria genom. Att utforma CRISPR-guider utifrån en referens som inte stämmer överens är som att programmera en kirurgisk robot med hjälp av bilddata från en annan patient. Tekniskt sett fungerar det. I praktiken är det farligt.
Isogenomisk kartläggning överbryggar den klyftan. En 9–10-faldig förbättring av kromosomspecificiteten är inte bara en marginell förbättring – det är skillnaden mellan en precis redigering och en slumpmässig sådan.
🗺️ Epigenomik: Kinetokoren – äntligen klarlagd
Det mest slående resultatet: när forskarteamet kartlade CENP-A (den histonvariant som markerar centromerens funktionella kärna) med hjälp av isogenomiska sekvenser kunde de för första gången fastställa den exakta placeringen av kinetokoren på varje kromosom, i båda haplotyperna.
Inget av de övriga referensgenom som testades – hg38, CHM13, HG002, T2T-YAO – kunde ge en tydlig CENP-A-signal med hög tillförlitlighet vid centromererna. Endast det matchande referensgenomet kunde avslöja signalen.
Detta är av enorm betydelse för att förstå fel i kromosomuppdelningen, vilka ligger till grund för aneuploidi, cancer och utvecklingsstörningar. För första gången har vi en haplotypupplöst karta över var kinetokoren faktiskt bildas – i en verklig, experimentellt användbar cellinje.
Biohackers slutsats: Personanpassad genomik kräver en personanpassad referens
Den precisionsgenomiska eran har alltid utlovat medicin och biologi som är skräddarsydd för varje enskild individ. Men om det första steget – avläsningen av ditt genom – utförs utifrån en felaktig mall, kommer alla efterföljande slutsatser att präglas av samma fel.
Det isogenomiska ramverket är den saknade pusselbiten. Så här fungerar det i praktiken:
| Vad du gör | Vad förändras med isogenomisk kartläggning |
|---|---|
| Hela genomsekvensering | Fler korrekta variantbestämningar, särskilt vid centromerer och andra områden med hög variation |
| RNA-sekvensering / transkriptomik | Eliminerade falska positiva resultat orsakade av referensartefakter vid genuttryck |
| Utformning av CRISPR-guider | Guider som validerats mot just din genomsekvens – inte en ersättning |
| Epigenetisk profilering | Klarlägger kromatintillstånd vid komplexa, repetitiva lokus som tidigare varit osynliga |
| Forskning inom precisionsmedicin | En grund för haplotypspecifika ingrepp |
Forskargruppen efterlyser en systematisk satsning på att skapa T2T-diploida genom för alla viktiga experimentella cellinjer. I takt med att detta bibliotek växer – iPS-celler, embryonala stamceller, primära cellinjer – ökar också möjligheterna att bedriva verkligt individanpassad funktionell genomik.
Dante Labs bygger den framtiden
För oss på Dante Labs är vårt bidrag till denna forskning ett direkt uttryck för vårt huvudsakliga uppdrag: att göra tillförlitlig genomisk information i hög upplösning tillgänglig. Vi har varit delaktiga i att ta fram och validera de sekvenseringsdata som möjliggjorde RPE1v1.1-sammanställningen och dessa upptäckter.
I takt med att fler cellinjespecifika referensgenom blir tillgängliga online är vi väl rustade att hjälpa både forskare, kliniker och biohackare att dra nytta av dem – för ett genom som avläses med precision är ett genom som man faktiskt kan agera utifrån.
Läs artikeln
"Referensmaterial anpassat till cellinjen möjliggör funktionell genomik med hög precision"
Corda, Volpe, Dallali, Di Tommaso, Colantoni, Guarracino, Chittoor, Capulli, Tassone, Giunta m.fl.
Nature Communications, vol. 16, artikel 11194 — Publicerad den 20 november 2025
→ Läs hela artikeln på Nature.com
Dante Labs är världsledande inom helgenomsekvensering och multi-omikanalys. Sekvensera ditt genom →
Få nya inlägg från Dante Labs
Insikter inom genomik, produktnyheter och kliniska perspektiv – direkt till din inkorg.