zdraví

Shortstop Salk Institute revolucionizuje genetické vyhledávání

Proteiny udržují život, jak to známe, a slouží mnoha důležitým strukturálním a funkčním rolím v celém těle. Tyto velké molekuly však vrhaly dlouhý stín na menší podtřídu proteinů zvanou mikroproteiny.

Mikroproteiny byly ztraceny v 99% DNA ignorované jako „nekódující“-v rozsáhlých tmavých úsecích neprozkoumaného genetického kódu. Ale přesto, že je malý a nepolapitelný, může být jejich dopad stejně velký jako větší proteiny.

Vědci Salk Institute nyní zkoumají záhadnou temnou stránku genomu při hledání mikroproteinů. Díky svému novému krátkému nástroji mohou vědci zkoumat genetické databáze a identifikovat úseky DNA v genomu, který pravděpodobně kóduje mikroproteiny.

Důležité je, že shortstop také předpovídá, které mikroproteiny jsou s největší pravděpodobností biologicky relevantní, což šetří čas a peníze při hledání mikroproteinů zapojených do zdraví a nemoci.

Shortstop svítí nové světlo na stávajících datových sadách a upozorňuje mikroproteiny dříve nemožné najít. Tým SALK již tento nástroj ve skutečnosti použil k analýze datového souboru rakoviny plic k nalezení 210 zcela nových kandidátů na mikroproteiny s jedním standout ověřeným mikroproteinem-který může v budoucnu přinést dobré terapeutické cíle.

Zjištění byla zveřejněna v Metody BMC 31. července 2025.

Většina proteinů v našem těle je dobře známa, ale nedávné objevy naznačují, že nám chyběly tisíce malých skrytých proteinů, které se mikroproteiny-kódované přehlíženými oblastmi našeho genomu. Vědci po dlouhou dobu skutečně studovali pouze oblasti DNA, které kódovaly velké proteiny, a zbytek zamítl jako „nevyžádanou DNA“, ale nyní se dozvíme, že tyto další regiony jsou ve skutečnosti velmi důležité a mikroproteiny, které produkují, by mohly hrát kritickou roli při regulaci zdraví a nemocí. “


Alan Saghatelian, studijní autor a profesor, Salk Institute

Více o mikroproteinech

Je obtížné detekovat a katalogizovat mikroproteiny, většinou kvůli jejich velikosti. Ve srovnání se standardními proteiny, které se mohou pohybovat od stovek do tisíců aminokyselin dlouhých, mikroproteiny obvykle obsahují méně než 150 aminokyselin, což je ztěžuje detekci pomocí standardních metod proteinové analýzy. Proto místo hledání samotných mikroproteinů vědci hledají velké, veřejně dostupné datové sady pro sekvence DNA, které je dělají.

Vědci se nyní dozvěděli, že určité úseky DNA nazývají malé otevřené čtení rámy (Smorfs) mohou obsahovat pokyny pro výrobu mikroproteinů. Současné experimentální metody již katalogizovaly tisíce Smorfů, ale tyto nástroje zůstávají časově náročné a drahé. Jejich neschopnost oddělit potenciálně funkční mikroproteiny od nefunkčních mikroproteinů navíc zastavila jejich objev a charakterizaci.

Jak funguje shortstop

Ne všechny Smorfy se překládají na biologicky smysluplné mikroproteiny. Existující metody nemohou rozlišovat mezi funkčními a nefunkčními smorfy generujícími mikroproteiny. To znamená, že vědci musí nezávisle otestovat každý mikroprotein, aby určili, zda je funkční nebo ne.

Shortstop radikálně mění tento pracovní postup a optimalizuje objev Smorf tříděním mikroproteinů do funkčních a nefunkčních kategorií. Klíčem k třídění ShortStopu je to, jak je vyškolen jako systém strojového učení. Její školení se spoléhá na datový soubor negativních kontrol počítačově generovaných náhodných smorfů. Shortstop porovnává smorfy s těmito návnadami, aby se rychle rozhodl, zda bude nový Smorf pravděpodobně funkční nebo nefunkční.

ShortStop nemůže definitivně říci, zda bude Smorf kódovat biologicky relevantní mikroprotein, ale tento dvou třídní systém se nesmírně zužuje po experimentálním fondu. Nyní mohou vědci trávit méně času ručním tříděním prostřednictvím datových sad a selháním na lavičce.

Když vědci použili shortstop na dříve publikovaný datový soubor SMORF, identifikovali 8% jako pravděpodobné funkční mikroproteiny a upřednostňovali je pro cílené sledování. To urychluje charakterizaci mikroproteinu filtrováním sekvencí nepravděpodobné, že by měly biologický význam. Shortstop by také mohl identifikovat mikroproteiny, které byly přehlíženy jinými metodami, včetně metody, které byly validovány detekovaným v lidských buňkách a tkáních.

„Co dělá shortstop obzvláště silným, je to, že funguje s běžnými datovými typy, jako jsou datové sady sekvenování RNA, které již mnoho laboratoří již používá,“ říká první autor Brendan Miller, postdoktorandský výzkumný pracovník v Saghatelianově laboratoři. „To znamená, že nyní můžeme hledat mikroproteiny napříč zdravými a nemocnými tkáněmi v měřítku, což odhalí nové poznatky o biologii člověka a odemkne nové cesty pro diagnostiku a léčbu onemocnění, jako je rakovina a Alzheimerova choroba.“

Shortstop skvrny mikroprotein spojené s rakovinou plic

Vědci již použili shortstop k identifikaci mikroproteinu, který byl upregulován v nádorech rakoviny plic. Analyzovali genetická data z lidských plicních nádorů a sousední normální tkáně, aby vytvořili seznam potenciálních funkčních smorfů. Mezi nalezenými Smorfs Shortstop byl jeden stál-byl exprimován více v nádorové tkáni než normální tkáň, což naznačuje, že může sloužit jako a Biomarker nebo funkční mikroprotein pro rakovinu plic

Identifikace tohoto mikroproteinu souvisejícího s rakovinou plic ukazuje hodnotu shortstop a strojového učení, aby upřednostňoval kandidáty pro budoucí výzkum a terapeutický vývoj.

„Existuje tolik údajů, které již existuje, že nyní můžeme zpracovat s shortstopem, abychom našli nové mikroproteiny spojené se zdravím a nemocemi, které se táhnou od Alzheimerovy poboje po obezitu i mimo něj,“ říká Saghatelian. „Můj tým je opravdu dobrý při vytváření metod as údaji z jiných fakult Salk můžeme tyto metody integrovat a urychlit vědu.“

Zdroj:

Reference časopisu:

Miller, B., et al. (2025). SHORTSTOP: Rámec strojového učení pro objev mikroproteinů. Metody BMC. doi.org/10.1186/S44330-025-00037-4

Zdrojový odkaz

Related Articles

Back to top button