Implantát mozku umožňuje člověku s ALS mluvit a zpívat svým „skutečným hlasem“

Implantát mozku umožňuje člověku s ALS mluvit a zpívat svým „skutečným hlasem“
Nové rozhraní mozkového počítače mění myšlenky na zpěv a expresivní řeč v reálném čase
Motorová kůra (Oranžová, ilustrace). Elektrody implantované v této oblasti pomohly zaznamenat mozkovou aktivitu týkající se řeči člověka, který nemohl srozumitelně mluvit.
Kateryna Kon/Science Photo Library/Alamy Reklamní fotografie
Muž se závažným postižením řeči je schopen mluvit expiretivně a zpívat pomocí implantátu mozku, který převádí jeho nervovou aktivitu do slov téměř okamžitě. Zařízení vyjadřuje změny tónu, když klade otázky, zdůrazňuje slova podle jeho výběru a umožňuje mu hučení řady poznámek ve třech hřištích.
Systém – známý jako Rozhraní mozkového a počítače (BCI) – Použil umělou inteligenci (AI) k dekódování elektrické mozkové aktivity účastníka, když se pokoušel mluvit. Zařízení je první, kdo reprodukuje nejen zamýšlená slova člověka, ale také rysy přirozené řeči, jako je tón, hřiště a důraz, které pomáhají vyjádřit význam a emoce.
Ve studii syntetický hlas, který napodobil vlastní účastníka, mluvil jeho slova do 10 milisekund od nervové aktivity, která signalizovala jeho záměr mluvit. Systém, popsaný dnes v PřírodaOznačuje významné zlepšení oproti dřívějším modelům BCI, který streamoval řeč do tří sekund nebo vytvořili jej pouze poté, co uživatelé dokončili napodobování celé věty.
O podpoře vědecké žurnalistiky
Pokud se vám tento článek líbí, zvažte podporu naší oceněné žurnalistiky předplatné. Zakoupením předplatného pomáháte zajistit budoucnost působivých příběhů o objevech a myšlenkách, které dnes formují náš svět.
„Toto je Svatý grál v řeči BCIS,“ říká Christian Herff, výpočetní neurovědec na Maastrichtské univerzitě v Nizozemsku, který se do studie nezúčastnil. „To je nyní skutečná, spontánní, nepřetržitá řeč.“
Dekodér v reálném čase
Účastník studie, 45letý muž, ztratil svou schopnost mluvit jasně po vývoji amyotrofní laterální skleróza, forma nemoci motorických neuronůcož poškozuje nervy, které kontrolují pohyby svalů, včetně nervů potřebných pro řeč. Přestože mohl stále vydávat zvuky a ústní slova, jeho řeč byla pomalá a nejasná.
Pět let po zahájení jeho příznaků účastník podstoupil chirurgický zákrok, aby vložil 256 křemíkových elektrod, každá 1,5 mm dlouhá v oblasti mozku, která kontroluje pohyb. Studijní spoluautor Maitreyee Wairagkar, neurovědec na Kalifornské univerzitě v Davisu, a její kolegové trénovali algoritmy hlubokého učení, aby zachytili signály v jeho mozku každých 10 milisekund. Jejich systém dekóduje, v reálném čase, zvuky, které se člověk pokouší produkovat spíše než jeho zamýšlená slova nebo základní fonémy – podjednotky řeči, které tvoří mluvená slova.
„Ne vždy používáme slova ke komunikaci toho, co chceme. Máme interjekce. Máme další expresivní vokalizace, které nejsou ve slovní zásobě,“ vysvětluje Wairagkar. „Abychom toho mohli udělat, přijali jsme tento přístup, který je zcela neomezený.“
Tým také personalizoval syntetický hlas, aby zněl jako mužský, tréninkem algoritmů AI na nahrávkách rozhovorů, které provedl před začátkem své nemoci.
Tým požádal účastníka, aby se pokusil provést interjekce jako „aah“, „ooh“ a „hmm“ a řekl vytvořená slova. BCI tyto zvuky úspěšně vytvořily a ukázaly, že by mohla generovat řeč, aniž by potřebovala pevnou slovní zásobu.
Svoboda slova
Pomocí zařízení účastník vysvětlil slova, odpověděl na otevřené otázky a řekl, co chce, pomocí některých slov, která nebyla součástí tréninkového dat dekodéru. Řekl vědcům, že naslouchání syntetickému hlasu produkuje, že jeho řeč způsobil, že se „cítil šťastný“ a že se cítil jako jeho „skutečný hlas“.
V jiných experimentech BCI identifikovala, zda se účastník pokoušel vyslovit větu jako otázku nebo jako prohlášení. Systém by také mohl určit, kdy zdůraznil různá slova ve stejné větě a podle toho upravit tón jeho syntetického hlasu. „Přinášíme všechny tyto různé prvky lidské řeči, které jsou opravdu důležité,“ říká Wairagkar. Předchozí BCIS mohl produkovat pouze plochou, monotónní řeč.
„Je to trochu posun paradigmatu v tom smyslu, že to může opravdu vést k skutečnému nástroji,“ říká Silvia Marchesotti, neuroengineer na Ženevské univerzitě ve Švýcarsku. Funkce systému „by byly zásadní pro adopci pro každodenní použití pro pacienty v budoucnosti“.
Tento článek je reprodukován se svolením a byl poprvé publikováno 11. června 2025.