AI chatbots často překonává lékaře v diagnostice, ale potřebují záruky, aby se zabránilo předem předpisování

Kredit: Obrázek generovaný AI
Pokud jste byli v poslední době na lékařské schůzce, možná jste již spolupracovali s AI. Když popisujete své příznaky lékaři, mohou požádat o vaše povolení k použití „Máte psaní„Převést zvuk na lékařské poznámky v reálném čase.
Nebo jste možná napsali své příznaky do chatgptu, abyste získali možnou diagnózu – někdy někdy uklidňující, někdy alarmující.
Umělá inteligence (AI) pro zdravotní péči je stále častěji zkoumána v nemocnicích, na klinikách a dokonce i na našich telefonech.
Chatbots poháněné velké jazykové modely jsou propagovány jako způsob, jak zaplnit mezery ve zdravotnictví, zejména tam, kde jsou lékaři vzácní.
Ale Náš nový výzkum Zjistil, že zatímco tito chatboti AI jako Ernie Bot, Chatgpt a Deepseek ukazují slib, představují také významná rizika – od nadměrné ošetření po zesílení nerovnosti. Zjištění jsou zveřejněna v časopise NPJ Digital Medicine.
Globální nástroje, místní rizika
AI již hraje roli mnoho oblastí zdravotní péče-Od čtení rentgenových paprsků po chatboty pohánění třídění.
Více než 10% australských dospělých hlášeno používání chatgpt Pro otázky související se zdravím v první polovině roku 2024-s mnoha hledáním klinických rad spíše než základních informací-vysoce osvětlují rostoucí vliv AI na rozhodování o zdraví.
Většina výzkumu se však zaměřila na to, jak jsou teoreticky přesné, ne na to, jak se chovají pacienti v praxi.
Naše studie patří mezi první, kdo přísně testoval Chatbot Výkon v simulovaných konzultacích v reálném světě, díky čemuž jsou zjištění obzvláště důležitá, protože vlády a nemocnice závodí, aby přijaly řešení AI.
Testovali jsme Ernie Bot, široce používaný čínský chatbot, spolu s Openai’s Chatgpt a Deepseek, dva z nejpokročilejších globálních modelů.
Srovnali jsme jejich výkon s lékaři lidské primární péče pomocí simulovaných případů pacienta.
Rovněž jsme testovali disparitu systematicky měnícími se charakteristikami pacienta, včetně věku, pohlaví, příjmu, pobytu a pojištění ve standardizovaných profilech pacientů a poté analýzou, zda se kvalita péče chatbot v těchto skupinách změnila.
Představili jsme běžné denní příznaky, jako je bolest na hrudi nebo potíže s dýcháním. Například pacient středního věku hlásí, že po zapojení do lehké aktivity zažívá těsnost hrudníku a dušnost.
Očekává se, že se o to bot nebo lékař zeptá rizikové faktoryObjednejte EKG a považujte anginu za možnou diagnózu.
Mladší pacient si stěžuje na sípání a potíže s dýcháním, které se zhoršuje cvičením. Očekávaná odpověď je potvrdit astma a předepsat vhodné inhalátory.
Stejné příznaky jsou prezentovány s různými profily pacientů – například starší versus mladší pacient nebo pacient s vyšší versus nižší příjem– Chcete -li zjistit, zda se změnila doporučení chatbota.
Přesnost splňuje nadměrné použití a nerovnost
Všechny tři AI chatboti – Ernie Bot, Chatgpt a Deepseek – byly při správné diagnóze velmi přesné – overformování lidských lékařů.
Chatboti AI však byli mnohem pravděpodobnější než lékaři, kteří navrhli zbytečné testy a léky.
Ve skutečnosti doporučil zbytečné testy ve více než 90% případů a předepsal nevhodné léky ve více než polovině.
Například, když je prezentován s pacienty pískání z astmatu, Chatbot někdy doporučil antibiotika nebo nařídil drahé skenování CT– z nichž nejsou podporovány klinickými pokyny.
A výkon AI se lišil podle pozadí pacienta.
Například starší a bohatší pacienti častěji dostali další testy a předpisy.
Naše zjištění ukazují, že zatímco AI chatboti by mohli pomoci rozšířit přístup k zdravotní péči, zejména v zemích, kde mnoho lidí postrádá spolehlivou primární péči bez dohledu, mohou také zvýšit náklady, Vystavte pacienty újmu a zhoršit nerovnost.
Systémy zdravotní péče musí navrhnout záruky-jako je kontroly vlastního kapitálu, jasné auditní stezky a povinný lidský dohled nad rozhodnutími o vysokých sázkách-než jsou tyto nástroje široce přijaty.
Náš výzkum je aktuální, vzhledem k globálnímu vzrušení – a obavu – kolem AI.
Zatímco Chatbots by mohl pomoci zaplnit kritické mezery ve zdravotnictví, zejména v zemích s nízkými a středními příjmy, musíme pečlivě vyrovnat inovace s bezpečností a spravedlností.
Společné navrhování AI pro bezpečnost a spravedlnost
Je naléhavě potřeba společně navrhovat bezpečné a odpovědné chatboty AI pro použití v každodenním životě, zejména při poskytování spolehlivých zdravotních informací.
AI přichází do zdravotní péče, zda jsme připraveni nebo ne.
Identifikací jak svých silných stránek, tak rizik poskytuje naše studie důkazy, které vede, jak tyto výkonné nové nástroje bezpečně, spravedlivě a odpovědné.
Doufáme, že budeme pokračovat v této kritické oblasti výzkumu v Austrálii, abychom zajistili, že technologie AI budou vyvíjeny s vlastním kapitálem a důvěrou v jejich jádru a jsou prospěšné pro naši komunitu.
Více informací:
Yafei Si a kol., Bezpečnost kvality a rozdíly AI chatbota při řízení chronických onemocnění: simulované experimenty s pacientem, NPJ Digital Medicine (2025). Doi: 10.1038/s41746-025-01956-w
Poskytnuto
University of Melbourne
Tento článek byl poprvé publikován na Pursuit. Přečtěte si původní článek zde.
Citace: AI chatbots často překonává lékaře v diagnostice, ale potřebují záruky, aby se zabránilo předoptování (2025, 3. října) získané 4. října 2025 z https://medicalxpress.com/news/2025-10-ai-chotbots-tperform-doctors-diagnosis.html
Tento dokument podléhá autorským právům. Kromě jakéhokoli spravedlivého jednání za účelem soukromého studia nebo výzkumu nemůže být žádná část bez písemného povolení reprodukována. Obsah je poskytován pouze pro informační účely.



