Bioemu AI odhaluje choreografii proteinu v biologických podmínkách

Proteiny nejsou tuhé sochy. Otočí, ohýbá a někdy rozpadnou – pohyby nezbytné pro pochopení jejich funkce. Některé proteiny, jako jsou enzymy, se otevírají jako véčka, aby chytily molekuly. Jiní, jako jsou signalizační proteiny, posunují tvar pro kontrolu buněčných procesů. Ještě jiní krátce odhalují skryté mezery, kde se drogy mohou vázat. Nástroje pro umělou inteligenci (AI), jako je Alphafold, provedly rutinu predikce struktury, ale obvykle poskytují pouze jednu stabilní formu, jediný snímky z toho, co je skutečně pohyblivou obrazem.
Nový hluboký vzdělávací systém s názvem Bioemu, vyvinutý společností Microsoft a vědci na Rice University v USA a Freie Universität v Německu, předpovídá celou škálu tvarů, které protein přirozeně zkoumá za biologických podmínek. Známý jako rovnovážný soubor umožňuje modelování proteinu s vysokým rozlišením v měřítku, na rozdíl od pomalejších a klasičtějších přístupů. Popsán v VědaBioemu je rychlejší a levnější, což umožňuje rozsáhlé předpovědi funkce proteinu.
Abychom pochopili význam bioemu, pomáhá vidět, proti čemu je. Zlatým standardem pro modelování flexibility proteinu je molekulární dynamika (MD), která sleduje atomové pohyby v milionech miliard sekundy pomocí nástrojů jako Gromacs nebo Anton.
Navzdory svému ultrafinovému rozlišení a přesnosti je MD pomalá a nákladná. Simulace pohybů v mikrosekundách nebo milisekundách může trvat desítky tisíc GPU hodin, a to i na superpočítačích.
Bioemu se tento úzký profil posouvá tím, že se spoléhá na model difúze AI. Pro trénink biomu, vědci nejprve nakrmili skutečné proteinové struktury, z milionů sestav předpovězených alfafoldem, 200 milisekund simulací MD zahrnujících tisíce proteinů a půl milionu mutantních sekvencí z experimentálních měření stability. Je to jako upustit cukrovou kostku do sklenice vody: původní struktura, jasná a definována, se postupně rozpustí. Skutečným úkolem společnosti Bioemu je naučit se, jak tento proces provozovat opačně: od hluku po cukrovou kostku. Jakmile je vyškolen, může generovat tisíce věrohodných proteinových konformací od nuly.
Bioemu vynikal v benchmarcích. Zachytil velké změny tvaru v enzymech, lokální rozvíjení, které přepíná proteiny zapnutou nebo vypnuto, a prchavé kryptické kapsy, dočasné štěrbiny, které mohou sloužit jako dokazační místa pro drogy, jako v proteinovém RAS vázaném na rakovinu. Předpovídala 83% velkých posunů a 70-81% malých změn přesně, včetně otevřených a uzavřených forem vitálního enzymu zvaného adenylát kináza. Tvrdě se také zabývalo předpovídat proteiny, které nemají pevnou 3D strukturu a to, jak mutace ovlivňují stabilitu proteinu.
Rychlé, ale ne plně podrobné
Zatímco MD simuluje, jak se proteiny pohybují v průběhu času, včetně interakcí s vodou a drogami, Bioemu rychle generuje snímky všech stabilních tvarů, které protein pravděpodobně přijme. Může produkovat tisíce těchto struktur za minuty až hodiny na jednom GPU. Ale nemůže to ukázat, jak se proces odvíjí.
„Pokud chce výzkumník pochopit, jak se droga dostane na skryté vazebné místo, může MD odhalit krok za krokem,“ říká Kalairasan Ponnuswamy, bioinformatik a docent na SRM Institute of Science and Technology. „Bioemu ukazuje konečné tvary, ne jak se tam protein dostane.“
MD také zpracovává posuny teploty, membrány a další podmínky, které statické předpovědi Bioemu zatím nemohou modelovat.
Bioemu také nemůže modelovat buněčné stěny, molekuly léčiva, změny pH nebo vykazovat spolehlivost predikce, jako je Alphafold. Je také omezen na jednotlivé řetězce a nemůže modelovat, jak proteiny interagují, klíčová součást většiny biologických procesů a lékových cílů.
„Je to lépe považováno za nástroj vytvářející hypotézu než zdroj konečných závěrů,“ říká Ponnuswamy.
S tím, jak systém roste, aby zvládl složitější proteiny a chemické interakce, mohou vědci stále potřebovat experimenty nebo starší simulační metody, aby se ověřil to, co navrhuje.
Koncepční pokrok je přesto jasný. Pokud Alphafold poskytl plán světového proteinu, Bioemu načrtne jeho choreografii. Rychlým zachycením flexibility napříč tisíci proteinů umožňuje rozsáhlým objevováním a funkčních studiích s méně omezeními zdrojů, poznamenává Ponnuswamy: „Úkoly, které trvaly týdny, nyní trvají hodiny.“
Zdůrazňuje však potřebu řádného výcviku a dovedností.
„Budoucí vědci budou potřebovat nejen hluboké uzemnění ve fyzice a chemii, ale budou také potřebovat plynulost strojového učení a fyzického modelování, aby odemkli skutečný potenciál takových hybridních přístupů.“
Vědci považují Biomu a MD za doplňkové nástroje. Bioemu může rychle generovat řadu věrohodných konformací, které MD pak může podrobně prozkoumat. Tento hybridní přístup by mohl výrazně zkrátit dobu simulace při zachování věrnosti.
Anirban Mukhopadhyay je genetickým tréninkem a vědeckým komunikátorem z Dillí.
Publikováno – 20. července 2025 05:30



