Nejlepší mapa lidského genomu odhaluje „skryté“ oblasti DNA

Dvacet dva let po dokončení projektu lidského genomu vědci odhalili nejrozsáhlejší katalog lidské genetické variace, jaký kdy byl sestaven.
Ve dvou nových článcích zveřejněných ve středu (23. července) v časopise Nature vědci sekvenovali DNA 1 084 lidí po celém světě. Využili nedávný technologický pokrok, aby analyzovali dlouhé úseky genetického materiálu od každé osoby, tyto fragmenty sešili dohromady a porovnali výsledné genomy v jemných detailech.
Výsledky prohlubují naše chápání „strukturálních variant“ v lidském genomu. Spíše než ovlivňující jediný „písmeno“ v kódu DNA ovlivňují takové varianty velké kousky kódu – mohou být odstraněny z genomu nebo přidány do genomu nebo zahrnují místa, kde byla DNA převrácena nebo přesunuta na jiné místo.
Studie odhalily „skryté“ rysy lidského genomu, které byly dříve příliš technologicky náročné na studium, řekl Jan Korbelprozatímní hlava Evropská molekulární biologická laboratoř (EMBL) HeidelbergKdo je spoluautorem obou nových dokumentů. Například velké části genomu obsahují kódy, které opakují znovu a znovu, a ty byly považovány za nefunkční.
„Asi před 20 lety jsme o tom přemýšleli jako o„ nezdravé DNA “ – dali jsme mu velmi špatný termín,“ řekl Korbel Live Science. „Stále více si uvědomuje, že tyto sekvence nejsou nezdravé,“ a nové dílo vrhá světlo na tyto dlouhodobé sekvence DNA.
Všechna data generovaná v nových studiích jsou navíc otevřeným přístupem, takže jiní v této oblasti mohou nyní vzít „zjištění, některé z nástrojů, které jsme vyvinuli, a používat je pro své účely k porozumění genetickému základu nemoci,“ řekl Korbel Live Science. „Důkladně věřím, že pokroky, které dnes vydáváme v přírodě, podmnožina z nich také učiní do diagnostiky.“
Související: Rasová a etnická identita lidí neodrážejí jejich genetický předky
Více než 1 000 genomů
Když byl v roce 2003 zveřejněn první návrh „úplného“ lidského genomu, ve skutečnosti chyběl asi 15% jeho sekvence kvůli technologickým omezením času. V roce 2013 se vědcům podařilo tuto mezeru uzavřít asi o polovinu. A konečně, v roce 2022, První lidský genom „bez mezery“ byl publikován.
V roce 2023 vědci publikovali První návrh lidského pangenomukterý zahrnoval DNA od 47 lidí po celém světě, spíše než převážně založen na DNA jedné osoby. A téhož roku vědci publikovali první chromozom, který byl kdy sekvenován od konce do konceProtože předchozí genom „bez mezery“ stále chyběl mužský pohlavní chromozom.
V posledních několika letech pole nadále postupovalo, díky novým technologiím a snahám o rozšíření vzorkování DNA nad rámec populací převážně evropského původu. Tato pokrok ohlašovala tyto dva dokumenty zveřejněné v přírodě tento týden.
V první studii vědci sekvenoval DNA 1 019 lidí představující 26 populací na pěti kontinentech. Pro analýzu DNA shromáždili vědci „dlouhé čtení“, z nichž každá se skládala z desítek tisíc párů bází; Jeden pár bází odpovídá jedné přívalu ve spirálovém žebříku molekuly DNA.
„S krátkými čteními přibližně 100 párů základních párů je obtížné rozlišovat mezi genomickými oblastmi, které vypadají podobně,“ vysvětlil spoluautor studie Ježíš Emiliano Sotelo-FonsecaDoktorský student v Centru pro genomickou regulaci (CGR) v Barceloně ve Španělsku. To platí zejména v opakujících se regionech genomu. „S delšími čteními, asi 20 000 párů základny, přiřazení každého čtení do jedinečné pozice v genomu je mnohem snazší,“ řekl v e -mailu Live Science.
Více než polovina nové genomické variace odkryté ve studii byla nalezena v těch složitých opakujících se regionech, včetně transpozonů, známých také jako skákání genů. Transpozony mohou přeskočit na různá místa v genomu, kopírovat a vkládat jejich kód. Někdy v závislosti na tom, kde přistávají, mohou destabilizovat genom, zavést škodlivé mutace a přispívat k nemocem, jako je rakovina.
„Naše studie ukazuje, že některé z těchto transpozonů mohou unést regulační sekvence, aby zvýšily jejich aktivitu a přispěly k pochopení biologických mechanismů za jejich mutagenitou,“ nebo schopnost spustit mutace, spoluautor studie Bernardo Rodríguez-MartínNezávislý člověk v CGR a bývalý postdoktor v Korbel’s Lab Lab, řekl Live Science v e -mailu.
Skákání genů mohou v podstatě projít jízdou s určitými regulačními molekulami – dlouhými nekódujícími RNA – a tento trik použít k tomu, aby si vytvořili mnohem více kopií sebe samých, než by obvykle. „To je pro nás velmi překvapivý mechanismus,“ řekl Korbel.
Související: Vědci právě objevili nový způsob, jakým buňky ovládají své geny
Od 95% do 99%
Druhá studie představovala mnohem méně genomů – celkem pouze 65 – ale sekvenoval tyto genomy komplexněji než první studie. První studie zachytila asi 95% každého analyzovaného genomu, zatímco druhá studie generovala 99%-kompletní genomy.
„Může to znít jako malý rozdíl, ale ve skutečnosti je to z pohledu vědce genomu,“ řekl Korbel. „Abychom získali posledních několik procent, je to hlavní úspěch.“
Tento skok vyžadoval různé techniky sekvenování a nové analytické přístupy. „Tento projekt použil špičkový software k sestavení genomů a identifikaci genetické variace, z nichž většina prostě před několika lety neexistovala,“ spoluautor Charles LeeProfesor v Jackson Laboratory for Genomic Medicine řekl v e -mailu Live Science.
Techniky sekvenování zahrnovaly ten, který generoval dlouhé čtení s velmi málo chybami a ten, který generoval ultralegové čtení, které byly o něco více náchylné k chybám. Na úkor analýzy méně genomů tento přístup přesto umožnil druhé studii zachytit úseky DNA, které byly v první zcela chybět, řekl Rodríguez-Martín.
Tyto „skryté“ regiony zahrnovaly Centromeresdůležité struktury v centrech chromozomy které jsou klíčem pro dělení buněk. Když se buňka připravuje na rozdělení, vlákna se připevňují k centromerům a poté chromozom vytáhnou do dvou. Studie zjistila, že u asi 7% centromerů existují pravděpodobně dvě místa, kde se tato vlákna mohou připojit, místo jednoho.
„To by mohlo znamenat, že tyto chromozomy jsou nestabilnější? Protože pokud se vřeteno (vlákno) připojí ke dvěma bokům, může se to zmatené,“ řekl Korbel. To je čistě spekulativní nápad, dodal, ale je to ten, který nyní lze prozkoumat. Dalším krokem bude experimentálně studovat účinky těchto variací centromerů, Lee souhlasil.
Problémy s rozdělením chromozomu mohou vést k různým podmínkám. Například „Downův syndrom je výsledkem chyby segregace chromozomu během buněčného dělení v meióze“, když se buňky rozdělily do spermatu a vejců, spoluautor Dr. Miriam zápasilaDocent asistent v Clemson University Center for Human Genetics, řekl Live Science v e -mailu.
Stejně jako první studie, druhá studie také poskytla bezprecedentní pohled na skákající geny, katalogizoval více než 12 900. Za rakovinou mohou spustit také skákání genů Různá genetická onemocnění Zvoláním mutací a také okamžité jemnější změny v tom, jak jsou geny zapnuty a vypnuty, poznamenal Konkel. Lepší pochopení rozmanitosti skákání genů může pomoci rozbalit jejich funkci v lidském zdraví a nemoci.
Při pohledu na obě studie mohou vědci nyní porovnat nově sekvenované genomy s jinými datovými sadami, které zahrnují jak genomové, tak zdraví údaje, poznamenal Korbel. To by byl první krok k propojení nově nalezených strukturálních variací s hmatatelnými zdravotními výsledky a nakonec k začlenění těchto poznatků do lékařské praxe.
„Některé klinické studie nebudou schopny ignorovat tyto (sekvenční) techniky, protože jim poskytnou vyšší citlivost k identifikaci variace,“ řekl Korbel. „Nechceš minout varianty.“
Pro zlepšení genomických dat je ještě třeba udělat více práce, dodal Lee. Z nedostatečně zastoupených populací by mohlo být začleněno více DNA a techniky sekvenování a software by mohly být dále upřesnitelné, aby byl tento proces efektivnější a přesnější. Mezitím však pár nových studií znamená hlavní technologický výkon.
„Tyto pokročilé nástroje byly nedávno vyvinuty pro zvládnutí obrovského množství dlouhodobých dat, která nyní používáme pro každý genom,“ řekl Lee. „Před několika lety bylo sestavení úplného lidského chromozomu od konce do konce, zejména včetně centromerů, prakticky nedosažitelné, protože software a algoritmy ještě nebyly zralé.“