Vědci používají algoritmus k určení mutací rizik nemoci v nekódující DNA

Vědci z dětské nemocnice ve Philadelphii (CHOP) a Perelman School of Medicine na Pennsylvánské univerzitě (Penn Medicine) úspěšně použili algoritmus k identifikaci potenciálních mutací, které zvyšují riziko nemoci v nekódujících oblastech naší DNA, které tvoří obrovskou většinu lidského genomu. Zjištění by mohla sloužit jako základ pro detekci variant spojených s onemocněním u řady běžných onemocnění. Zjištění byla dnes zveřejněna online American Journal of Human Genetics.
Zatímco některé řezy lidského genomového kódu pro proteiny k provádění různých základních biologických funkcí, více než 98% genomu nekoderuje pro proteiny. Varianty spojené s onemocněním však lze také nalézt v těchto nekódujících oblastech genomu, které často kontrolují, když jsou proteiny vyrobeny nebo „exprimovány“. Vzhledem k tomu, že tento „regulační zákon“ není dobře pochopen, byly tyto nekódující varianty obtížnější studovat, ale předchozí studie sdružení (GWAS) v celém genomu (GWAS) učinily velké kroky v porozumění jejich klinickému významu.
Jednou z výzev je, že zatímco široké regiony lze GWAS identifikovat jako spojené s onemocněním, což je, která varianta mezi několika je zodpovědná, která je odpovědná za nemoc, zůstává výzvou. Mnoho z těchto variant v nekódujících oblastech je koncentrováno kolem motivů vazebných faktorů transkripčních faktorů, které jsou v genomu, které specifické proteiny, nazývané transkripční faktory, rozpoznávají a vážou, aby regulovaly genovou expresi. Zatímco tyto proteiny se vážou v regionech na genomu, které jsou „otevřené“, dočasně se „uzavírají“ bezprostřední oblast DNA, na kterou se vážou, a ponechání „stopy“ v experimentálních výsledcích, které lze použít k umístění přesně tam, kde jsou vazba.
„Tato situace je srovnatelná s policejní sestavou“řekl autor senior studie Struan FA Grant, PhD, ředitel Centra pro prostorovou a funkční genomiku a Daniel B. Burke židle pro výzkum diabetu ve společnosti Chop.“Díváte se na podobné podezřelé společně, takže může být náročné vědět, kdo je skutečným viníkem. S přístupem, který jsme použili v této studii, jsme schopni určit variantu způsobující nemoci prostřednictvím identifikace této tzv. Stopy“
V této studii vědci využili ATAC-SEQ, experimentální metodu genomického sekvenování, která identifikovala „otevřené“ oblasti genomu a tisklo, metodu založenou na hlubokém učení k detekci těchto typů stop interakcí DNA-protein. Pomocí údajů ze 170 vzorků lidských jater pozorovali vědci 809 „lokusu kvantitativních znaků“ nebo specifické části lidské genomiky spojené s těmito stopami, které naznačují, kde by měly probíhat interakce DNA-protein. Pomocí této metody mohli vědci určit, zda jsou transkripční faktory vázány s různou pevností na tato místa v závislosti na variantě.
S těmito užitečnými základními informacemi autoři studie doufají, že tyto techniky aplikují na jiné vzorky orgánů a tkání a začnou identifikovat, které z těchto variant potenciálně řídí řadu běžných onemocnění.
„Tento přístup pomáhá vyřešit některé základní problémy, se kterými jsme se v minulosti setkali“řekl autor první studie Max Dudek, student PhD v Grant a Almasy Labs na Katedře genetiky v Penn Medicine a na ministerstvu pediatrie v dětské nemocnici ve Philadelphii.“S větší velikostí vzorků se domníváme, že určení těchto neformálních variant by mohlo nakonec informovat o návrhu nových ošetření běžných nemocí“
Tato studie byla podpořena programem National Science Foundation Graduate Research Fellowship Program, National Institute of Health Grants R01 HL133218, U10 AA008401, UM1 DK126194, U24 DK138512, UM1 DK126194 a R01 HD05645 a DANIEL B. BURKE PRAVIDLA.
Zdroj:
Reference časopisu:
Dudek, mf, et al. (2025). Charakterizace nekódujících variant spojených s vazbou transkripční faktory prostřednictvím QTL definovaných ATAC-Seq v játrech. American Journal of Human Genetics. doi.org/10.1016/j.ajhg.2025.03.019.