Nástroj AI s otevřeným zdrojovým kódem odpovídá komerčním systémům při hlášení lékařského skenování

Nová studie z University of Colorado Anschutz Medical Campus ukazuje, že nástroje bezplatné, open-source umělé inteligence (AI) mohou lékařům pomoci nahlásit lékařské skenování stejně jako dražší komerční systémy, aniž by ohrožovaly soukromí pacientů.
Studie byla dnes zveřejněna v časopise NPJ Digital Medicine.
Výzkum zdůrazňuje slibnou a nákladově efektivní alternativu k široce známým nástrojům, jako je CHATGPT, které jsou často drahé a mohou vyžadovat odesílání citlivých dat na externí servery.
Toto je velká vítězství pro poskytovatele zdravotní péče a pacienty. Ukázali jsme, že nemocnice nepotřebují drahé nebo systémy AI na soukromí riziko, aby dosáhly přesných výsledků. “
Aakriti Pandita, MD, hlavní autor studie a docent nemocniční medicíny na University of Colorado School of Medicine
Lékaři často diktují poznámky nebo píší volné textové zprávy při kontrole lékařských skenů, jako jsou ultrazvuk. Tyto poznámky jsou cenné, ale nejsou vždy ve formátu, který je vyžadován pro různé klinické potřeby. Strukturování těchto informací pomáhá nemocnicím sledovat výsledky pacienta, spojit trendy a provádět výzkum efektivněji. Nástroje AI se stále častěji používají k zrychlení a přesnějším.
Mnoho z nejpokročilejších systémů AI, například GPT-4 z OpenAI, však vyžaduje odesílání údajů o pacientech přes internet na externí servery. To je problém ve zdravotnictví, kde zákony o ochraně osobních údajů dělají ochranu údajů o pacientech nejvyšší prioritu.
Nová studie zjistila, že bezplatné modely AI, které mohou být použity uvnitř nemocničních systémů bez odesílání dat jinde, fungují stejně dobře a někdy lepší než komerční možnosti.
Výzkumný tým se zaměřil na konkrétní lékařský problém: uzly štítné žlázy, hrudky v krku, často se vyskytují během ultrazvuku. Lékaři používají bodovací systém s názvem Acr Ti-Rads k vyhodnocení toho, jak pravděpodobné, že tyto uzly budou rakovinné.
Pro trénování nástrojů AI bez použití skutečných údajů o pacientech vědci vytvořili 3 000 falešných nebo „syntetických“. Radiologie zprávy. Tyto zprávy napodobovaly druh jazyka, který lékaři používají, ale neobsahovali žádné soukromé informace. Tým poté trénoval šest různých bezplatných modelů AI, aby si tyto zprávy přečetl a skóroval.
Testovali modely na 50 skutečných zprávách o pacientech z veřejného souboru a porovnali výsledky s komerčními nástroji AI, jako jsou GPT-3.5 a GPT-4. Jeden model s otevřeným zdrojovým kódem, nazvaný Yi-34B, se hrál a také GPT-4, když byl uveden z několika příkladů, ze kterého se lze učit. V některých testech byly i menší modely, které mohou běžet na běžných počítačích, lépe než GPT-3,5.
„Komerční nástroje jsou silné, ale nejsou vždy praktické ve zdravotnictví,“ řekl Nikhil Madhuripan, MD, vedoucí autor studie a prozatímní šéf sekce břišní radiologie na University of Colorado School of Medicine. „Jsou drahé a používání je obvykle znamená zasílat údaje o pacientech na servery společnosti, které mohou představovat závažné obavy o ochranu osobních údajů.“
Naproti tomu nástroje Open-Source AI mohou běžet uvnitř vlastního zabezpečeného systému nemocnice. To znamená, že budovu nemusí opustit žádné citlivé informace a není třeba kupovat velké a drahé klastry GPU.
Studie také ukazuje, že syntetická data mohou být bezpečným a efektivním způsobem, jak trénovat nástroje AI, zejména pokud je přístup ke skutečným záznamům pacientů omezený. To otevírá dveře vytváření přizpůsobených a cenově dostupných systémů AI pro mnoho oblastí zdravotní péče.
Tým doufá, že jejich přístup lze použít nad radiologii. V budoucnu Pandita uvedla, že podobné nástroje by mohly lékařům pomoci zkontrolovat zprávy CT, organizovat lékařské poznámky nebo sledovat, jak nemoci postupem času postupují.
„Nejde jen o úsporu času,“ řekla Pandita. „Jde o to, aby nástroje AI byly skutečně použitelné v každodenním lékařském prostředí bez porušení banky nebo ohrožení soukromí pacienta.“
Zdroj:
Reference časopisu:
Pandita, A., et al. (2025). Syntetické údaje vyškolené jazykové modely s otevřeným zdrojovým kódem jsou proveditelnými alternativami k proprietárním modelům pro reporting radiologie. NPJ Digital Medicine. doi.org/10.1038/S41746-025-01658-3.



