AI identifikuje sady klíčových genů, které způsobují složité onemocnění

Biofyzicisté Northwestern University vyvinuli nový výpočetní nástroj pro identifikaci kombinací genů, na nichž jsou základem komplexních onemocnění, jako je diabetes, rakovina a astma. Na rozdíl od poruch jednoho genu jsou tyto podmínky ovlivněny sítí více genů, které spolupracují. Kredit: Camila Felix
Biofyzicisté Northwestern University vyvinuli nový výpočetní nástroj pro identifikaci kombinací genů, na nichž jsou základem komplexních onemocnění, jako je diabetes, rakovina a astma.
Na rozdíl od poruch jednoho genu jsou tyto podmínky ovlivněny sítí více genů, které spolupracují. Pouhý počet možných kombinací genů je však pro vědce neuvěřitelně obtížné určit konkrétní ty, které způsobují choroba.
Pomocí generativního modelu umělé inteligence (AI) Amplifikuje nová metoda Limited genová exprese data, která vědcům umožňuje řešit vzorce genové aktivity, které způsobují složité rysy. Tato informace by mohla vést k nové a účinnější léčbě onemocnění zahrnující molekulární cíle spojené s více geny.
Studie „Generativní predikce kauzálních genových sad odpovědných za složité rysy“ Publikováno v Sborník Národní akademie věd.
„Mnoho nemocí je určeno kombinací genů – nejen jedním,“ řekl Northwestern’s Adilson Motter, vedoucí autor studie.
„Můžete porovnat onemocnění, jako je rakovina s havárií letadla, ve většině případů musí dojít k vícenásobným selháním, aby se letadlo zhroutilo, a různé kombinace selhání mohou vést k podobným výsledkům. To komplikuje úkol určit příčiny. Náš model pomáhá zjednodušit věci tím, že identifikuje klíčové hráče a jejich kolektivní vliv.“
Odborník na Složité systémyMotter je profesorem fyziky Charles E. a Emma H. Morrison na Northwestern’s Weinberg College of Arts and Sciences a ředitel Centra pro dynamiku sítě. Ostatní autoři studie-vše spojené s Motterovou laboratoří-jsou postdoktorandským výzkumníkem Benjaminem Kuznetsem-Speckem, postgraduálním studentem Buduka Ogonor a výzkumný spolupracovník Thomas Wytock.
Aktuální metody nedosahují
Po celá desetiletí se vědci snažili odhalit genetické základy složitých lidských rysů a nemocí. Dokonce i neodessilé rysy, jako je výška, inteligence a barva vlasů, závisí na sbírkách genů.
Existující metody, například Studie asociace celého genomuPokuste se najít jednotlivé geny spojené s vlastností. Chybí jim však statistická síla k detekci kolektivních účinků skupin genů.
„Projekt lidského genomu nám ukázal, že máme jen šestkrát tolik genů jako bakterie s jedním buňkami,“ řekl Motter.
„Ale lidé jsou mnohem sofistikovanější než bakterie a počet genů to nevysvětluje. To zdůrazňuje prevalenci multigenních vztahů a že to musí být interakce mezi geny, které vedou ke složitému životu.“
„Identifikace jednotlivých genů je stále cenná,“ dodal Wytock. „Ale existuje jen velmi malá frakce pozorovatelných vlastností nebo fenotypů, které lze vysvětlit změnami v jednotlivých genů. Místo toho víme, že fenotypy jsou výsledkem mnoha genů, které spolupracují.
Ne geny, ale exprese genu
Pomoci překlenout dlouhodobou mezeru v znalostech mezi Genetický make -up (genotyp) a pozorovatelné rysy (fenotyp), výzkumný tým vyvinul sofistikovaný přístup, který kombinuje strojové učení s optimalizací.
Model se nazývá transkriptomově široký podmíněný variační auto-encodér (Twave), využívá generativní AI k identifikaci vzorců z omezených dat genové exprese u lidí. V souladu s tím může napodobovat nemocné a zdravé stavy tak, aby změny v genové expresi mohly být spojeny se změnami fenotypu.
Místo zkoumání účinků jednotlivých genů izolovaně identifikuje model skupiny genů, které kolektivně způsobují, že se objeví komplexní vlastnost. Metoda pak používá optimalizační rámec k určení specifických změn genů, které s největší pravděpodobností přesunou stav buňky ze zdravého na nemocné nebo naopak.
„Nedíváme se na genovou sekvenci, ale na expresi genu,“ řekl Wytock. „Vyškolili jsme náš model ohledně údajů z klinických studií, takže víme, které profily exprese jsou zdravé nebo nemocné. Pro menší počet genů také máme experimentální data To říká, jak síť reaguje, když je gen zapnutý nebo vypnut, což se můžeme shodovat s daty exprese, abychom našli geny zapojené do nemoci. “
Zaměření na expresi genu má více výhod. Nejprve obchází problémy s ochranou osobních údajů pacienta. Genetická data – skutečná sekvence DNA osoby – jsou ze své podstaty jedinečná pro jednotlivce a poskytují vysoce osobní plán zdraví, genetické predispozice a rodinné vztahy.
Na druhé straně jsou data exprese spíše jako dynamický snímek buněčné aktivity. Za druhé, data genové exprese implicitně odpovídají Environmentální faktorykteré mohou otočit geny „nahoru“ nebo „dolů“, aby vykonávaly různé funkce.
„Environmentální faktory nemusí ovlivnit DNA, ale rozhodně ovlivňují expresi genu,“ řekl Motter. „Náš model má tedy výhodu, že nepřímo účtuje faktory prostředí.“
Cesta k personalizovanému léčbě
Abychom prokázali Twaveovu účinnost, tým jej testoval na několika složitých nemocech. Tato metoda úspěšně identifikovala geny – z nichž některé byly vynechány existujícími metodami -, které tyto nemoci způsobily.
Twave také odhalil, že různé sady genů mohou u různých lidí způsobit stejné komplexní onemocnění. Toto zjištění naznačuje, že personalizovaná léčba by mohla být přizpůsobena specifickým genetickým ovladačům nemoci pacienta.
„Nemoc se může projevit podobně u dvou různých jedinců,“ řekl Motter. „V zásadě by však mohla existovat jiná sada genů pro každou osobu kvůli genetickým, environmentálním a životním stylu. Tato informace by mohla orientovat personalizované zacházení.“
Více informací:
Motter, Adilson E., Generativní predikce kauzálních genových sad odpovědných za složité rysy, Sborník Národní akademie věd (2025). Doi: 10.1073/pnas.2415071122. doi.org/10.1073/pnas.2415071122
Poskytnuto
Northwestern University
Citace: AI identifikuje klíčové genové sady, které způsobují komplexní onemocnění (2025, 9. června) získané 9. června 2025 z https://medicalxpress.com/news/2025-06-ai-key-gene-complex-deseases.html
Tento dokument podléhá autorským právům. Kromě jakéhokoli spravedlivého jednání za účelem soukromého studia nebo výzkumu nemůže být žádná část bez písemného povolení reprodukována. Obsah je poskytován pouze pro informační účely.