věda

Umělá inteligence dekóduje vizuální aktivitu mozku – a píše k ní titulky

Umělá inteligence dekóduje vizuální aktivitu mozku – a píše k ní titulky

Neinvazivní zobrazovací technika dokáže převést scény ve vaší hlavě do vět. Mohlo by to pomoci odhalit, jak mozek interpretuje svět

Funkční magnetická rezonance je neinvazivní způsob zkoumání mozkové aktivity.

PBH Images/Alamy Stock Photo

Čtení myšlenek člověka pomocí záznamu jeho mozkové aktivity zní futuristicky, ale nyní je o krok blíže realitě. Nová technika zvaná „mind captioning“ generuje popisné věty toho, co člověk vidí nebo si představuje ve své mysli, pomocí čtení jeho mozkové aktivity s působivou přesností.

Technika popsaná v článku publikovaném dnes v Vědecké pokrokytaké nabízí vodítka pro to, jak mozek reprezentuje svět, než jsou myšlenky převedeny do slov. A možná by to šlo pomáhat lidem s jazykovými problémyjako jsou ty způsobené mrtvicí, aby se lépe komunikovalo.

Model předpovídá, na co se člověk dívá, „se spoustou detailů“, říká Alex Huth, počítačový neurolog z Kalifornské univerzity v Berkeley. „To je těžké. Je překvapivé, že můžete získat tolik detailů.“


O podpoře vědecké žurnalistiky

Pokud se vám tento článek líbí, zvažte podporu naší oceňované žurnalistiky předplatné. Zakoupením předplatného pomáháte zajistit budoucnost působivých příběhů o objevech a nápadech, které formují náš dnešní svět.


Skenujte a předvídejte

Vědci dokázali přesně předpovědět, co člověk vidí nebo slyší pomocí jejich mozkové aktivity více než deset let. Ale dekódování mozkové interpretace složitého obsahu, jako jsou krátká videa nebo abstraktní tvary, se ukázalo jako obtížnější.

Předchozí pokusy identifikovaly pouze klíčová slova, která popisují to, co člověk viděl, spíše než úplný kontext, který by mohl zahrnovat předmět videa a akce, které se v něm odehrávají, říká Tomoyasu Horikawa, počítačový neurolog z NTT Communication Science Laboratories v Kanagawa, Japonsko. Jiné pokusy použily modely umělé inteligence (AI), které samy dokážou vytvořit strukturu vět, takže je obtížné zjistit, zda byl popis skutečně reprezentován v mozku, dodává.

Horikawova metoda nejprve použila model umělé inteligence v hlubokém jazyce k analýze textových titulků více než 2 000 videí, přičemž každé z nich proměnilo v jedinečný numerický „signaturu významu“. Samostatný nástroj AI byl poté trénován na skenování mozku šesti účastníků a během sledování videí se účastníci naučili najít vzorce mozkové aktivity, které se shodovaly s každým významovým podpisem.

Jakmile byl tento dekodér vycvičen, mohl přečíst nový sken mozku od osoby sledující video a předpovědět významový podpis. Pak by jiný generátor textu AI hledal větu, která se nejvíce blíží významu signatury dekódované z mozku jednotlivce.

Účastník například sledoval krátké video člověka skákajícího z vrcholu vodopádu. Pomocí jejich mozkové aktivity model AI uhádl řetězce slov, počínaje „jarním prouděním“, přes desátý odhad k „nadrychlému pádu vody“ a na 100. odhadu dospěl k „člověk skočí přes hluboký vodopád na horském hřebeni“.

Výzkumníci také požádali účastníky, aby si vzpomněli na videoklipy, které viděli. Modely umělé inteligence úspěšně vytvořily popisy těchto vzpomínek, což ukazuje, že mozek zřejmě používá podobnou reprezentaci jak pro prohlížení, tak pro zapamatování.

Čtení budoucnosti

Tato technika, která využívá neinvazivní funkční zobrazování magnetickou rezonancí, by mohla pomoci zlepšit proces implantované rozhraní mozek-počítač může převést neverbální mentální reprezentace lidí přímo do textu. „Pokud to dokážeme pomocí těchto umělých systémů, možná můžeme pomoci těmto lidem s komunikačními potížemi,“ říká Huth, který v roce 2023 se svými kolegy vyvinul podobný model, který dekóduje jazyk z neinvazivních záznamů mozku.

Tato zjištění zvyšují obavy o duševní soukromíHuth říká, jak se výzkumníci přibližují k odhalování intimních myšlenek, emocí a zdravotních stavů, které by teoreticky mohly být použity pro sledování, manipulaci nebo diskriminaci lidí. Ani Huthův model, ani Horikawův model nepřekračují čáru, říkají oba, protože tyto techniky vyžadují souhlas účastníků a modely nemohou rozlišovat soukromé myšlenky. „Ještě nikdo neukázal, že to dokážeš,“ říká Huth.

Tento článek je reprodukován se svolením a byl poprvé zveřejněno dne 5. listopadu 2025.

Je čas postavit se za vědu

Pokud se vám tento článek líbil, rád bych vás požádal o podporu. Scientific American sloužil jako obhájce vědy a průmyslu již 180 let a právě teď může nastat nejkritičtější okamžik v této dvousetleté historii.

Byl jsem a Scientific American předplatitel od mých 12 let a pomohlo mi to utvářet můj pohled na svět. SciAm vždy mě vzdělává a těší a vzbuzuje úctu k našemu obrovskému, krásnému vesmíru. Doufám, že to udělá i vám.

Pokud vy přihlásit se k odběru Scientific Americanpomáháte zajistit, aby se naše pokrytí soustředilo na smysluplný výzkum a objevy; že máme zdroje na podávání zpráv o rozhodnutích, která ohrožují laboratoře v USA; a že podporujeme začínající i pracující vědce v době, kdy hodnota samotné vědy příliš často zůstává nepoznaná.

Na oplátku získáte zásadní zprávy, strhující podcastyskvělá infografika, nepřehlédnutelné newsletteryvidea, která musíte vidět, náročné hrya nejlepší vědecké psaní a zpravodajství. Můžete dokonce darovat někomu předplatné.

Nikdy nebyl důležitější čas, abychom vstali a ukázali, proč na vědě záleží. Doufám, že nás v této misi podpoříte.

Zdrojový odkaz

Related Articles

Back to top button