Digitální hlasové záznamy obsahují cenné informace, které mohou naznačovat kognitivní zdraví jednotlivce a nabízejí neinvazivní a efektivní metodu pro posouzení. Výzkum ukázal, že opatření digitálního hlasu mohou detekovat časné příznaky kognitivního poklesu analýzou vlastností, jako je rychlost řeči, artikulace, variace rozteče a pauzy, což může signalizovat kognitivní poškození při odchylce od normativních vzorců.
Hlasová data však představují výzvy v oblasti ochrany osobních údajů kvůli osobně identifikovatelným informacím zabudovaným do záznamů, jako je pohlaví, přízvuk a emocionální stav, jakož i jemnější charakteristiky řeči, které mohou jedinečně identifikovat jednotlivce. Tato rizika jsou zesílena, když jsou hlasová data zpracovávána automatizovanými systémy, což vyvolává obavy o RE–Identifikace a potenciální zneužití dat.
V nové studii vědci z Bostonské univerzity Chobanian & Avedisian School of Medicine zavedli výpočetní rámec, který uplatňuje posun hřiště, což je technika zvukového záznamu, která mění hřiště zvuku, buď zvyšuje nebo snižuje, chrání identitu reproduktorů a zároveň zachovává akustické rysy nezbytné pro kognitivní hodnocení.
Tím, že využívají techniky využití, jako je přesun tónu jako prostředek pro zhoršení hlasu, jsme prokázali schopnost zmírnit rizika soukromí a zároveň zachovat diagnostickou hodnotu akustických prvků. “
Vijaya B. Kolachalama, PhD, Faha, odpovídající autor, docent medicíny
Pomocí údajů ze studie Framingham Heart Study (FHS) a Demencebank Delaware (DBD) vědci aplikovali posun rozteče na různých úrovních a začlenili další transformace, jako jsou časové úpravy a přidání šumu, aby změnili hlasové charakteristiky odpovědí na neuropsychologické testy. Poté hodnotili zkažení reproduktoru stejnou mírou chyb a diagnostické užitečnosti prostřednictvím přesnosti klasifikace modelů strojového učení rozlišujícího kognitivní stavy: normální kognitivní (NC), mírné kognitivní poškození (MCI) a demence (DE).
Pomocí zkazených řečových souborů byl výpočetní rámec schopen přesně určit NC, MCI a DE diferenciaci v 62% datové sady FHS a 63% datového souboru DBD.
Podle vědců tato práce přispívá k etické a praktické integraci hlasových údajů do lékařských analýz a zdůrazňuje důležitost ochrany soukromí pacienta při zachování integrity kognitivních hodnocení zdraví. „Tato zjištění připravují cestu pro rozvoj standardizovaných pokynů zaměřených na soukromí pro budoucí aplikace hlasových hodnocení v klinickém a výzkumném prostředí,“ dodává Kolachalama, která je také docentem počítačové vědy, affiliate fakulty Hariri Institute pro výpočet a zakládající člen výpočetních a datových věd.
Tato zjištění se objevují online v Alzheimerově a demenci: Journal of Alzheimerovy asociace.
Tento projekt byl podporován granty od Národního institutu pro umělou inteligenci a technologické spolupráce Aging (P30-AG073104 a P30-AG073105), American Heart Association (20SFRN35460031), Gates Ventures a National Institute of Health (R01-HL159620, R01-AG011109).
Zdroj:
Reference časopisu:
Ahangaran, M., et al. (2025). Zbavení se nasazením výstavy pro vyvážení soukromí a diagnostického užitečnosti v hlasovém kognitivním hodnocení. Alzheimerova a demence. doi.org/10.1002/alz.70032.