Umělá inteligence dekóduje vizuální aktivitu mozku – a píše k ní titulky

Lucie Tomanová 6 listopadu, 2025

0 3 minutes read

6. listopadu 2025

3 min přečteno

Umělá inteligence dekóduje vizuální aktivitu mozku – a píše k ní titulky

Neinvazivní zobrazovací technika dokáže převést scény ve vaší hlavě do vět. Mohlo by to pomoci odhalit, jak mozek interpretuje svět

Podle Max Kozlov & Časopis Příroda

Funkční magnetická rezonance je neinvazivní způsob zkoumání mozkové aktivity.

PBH Images/Alamy Stock Photo

Čtení myšlenek člověka pomocí záznamu jeho mozkové aktivity zní futuristicky, ale nyní je o krok blíže realitě. Nová technika zvaná „mind captioning“ generuje popisné věty toho, co člověk vidí nebo si představuje ve své mysli, pomocí čtení jeho mozkové aktivity s působivou přesností.

Technika popsaná v článku publikovaném dnes v Vědecké pokrokytaké nabízí vodítka pro to, jak mozek reprezentuje svět, než jsou myšlenky převedeny do slov. A možná by to šlo pomáhat lidem s jazykovými problémyjako jsou ty způsobené mrtvicí, aby se lépe komunikovalo.

Model předpovídá, na co se člověk dívá, „se spoustou detailů“, říká Alex Huth, počítačový neurolog z Kalifornské univerzity v Berkeley. „To je těžké. Je překvapivé, že můžete získat tolik detailů.“

O podpoře vědecké žurnalistiky

Pokud se vám tento článek líbí, zvažte podporu naší oceňované žurnalistiky předplatné. Zakoupením předplatného pomáháte zajistit budoucnost působivých příběhů o objevech a nápadech, které formují náš dnešní svět.

Skenujte a předvídejte

Vědci dokázali přesně předpovědět, co člověk vidí nebo slyší pomocí jejich mozkové aktivity více než deset let. Ale dekódování mozkové interpretace složitého obsahu, jako jsou krátká videa nebo abstraktní tvary, se ukázalo jako obtížnější.

Předchozí pokusy identifikovaly pouze klíčová slova, která popisují to, co člověk viděl, spíše než úplný kontext, který by mohl zahrnovat předmět videa a akce, které se v něm odehrávají, říká Tomoyasu Horikawa, počítačový neurolog z NTT Communication Science Laboratories v Kanagawa, Japonsko. Jiné pokusy použily modely umělé inteligence (AI), které samy dokážou vytvořit strukturu vět, takže je obtížné zjistit, zda byl popis skutečně reprezentován v mozku, dodává.

Horikawova metoda nejprve použila model umělé inteligence v hlubokém jazyce k analýze textových titulků více než 2 000 videí, přičemž každé z nich proměnilo v jedinečný numerický „signaturu významu“. Samostatný nástroj AI byl poté trénován na skenování mozku šesti účastníků a během sledování videí se účastníci naučili najít vzorce mozkové aktivity, které se shodovaly s každým významovým podpisem.

Jakmile byl tento dekodér vycvičen, mohl přečíst nový sken mozku od osoby sledující video a předpovědět významový podpis. Pak by jiný generátor textu AI hledal větu, která se nejvíce blíží významu signatury dekódované z mozku jednotlivce.

Účastník například sledoval krátké video člověka skákajícího z vrcholu vodopádu. Pomocí jejich mozkové aktivity model AI uhádl řetězce slov, počínaje „jarním prouděním“, přes desátý odhad k „nadrychlému pádu vody“ a na 100. odhadu dospěl k „člověk skočí přes hluboký vodopád na horském hřebeni“.

Výzkumníci také požádali účastníky, aby si vzpomněli na videoklipy, které viděli. Modely umělé inteligence úspěšně vytvořily popisy těchto vzpomínek, což ukazuje, že mozek zřejmě používá podobnou reprezentaci jak pro prohlížení, tak pro zapamatování.

Čtení budoucnosti

Tato technika, která využívá neinvazivní funkční zobrazování magnetickou rezonancí, by mohla pomoci zlepšit proces implantované rozhraní mozek-počítač může převést neverbální mentální reprezentace lidí přímo do textu. „Pokud to dokážeme pomocí těchto umělých systémů, možná můžeme pomoci těmto lidem s komunikačními potížemi,“ říká Huth, který v roce 2023 se svými kolegy vyvinul podobný model, který dekóduje jazyk z neinvazivních záznamů mozku.

Tato zjištění zvyšují obavy o duševní soukromíHuth říká, jak se výzkumníci přibližují k odhalování intimních myšlenek, emocí a zdravotních stavů, které by teoreticky mohly být použity pro sledování, manipulaci nebo diskriminaci lidí. Ani Huthův model, ani Horikawův model nepřekračují čáru, říkají oba, protože tyto techniky vyžadují souhlas účastníků a modely nemohou rozlišovat soukromé myšlenky. „Ještě nikdo neukázal, že to dokážeš,“ říká Huth.

Tento článek je reprodukován se svolením a byl poprvé zveřejněno dne 5. listopadu 2025.

Je čas postavit se za vědu

Pokud se vám tento článek líbil, rád bych vás požádal o podporu. Scientific American sloužil jako obhájce vědy a průmyslu již 180 let a právě teď může nastat nejkritičtější okamžik v této dvousetleté historii.

Byl jsem a Scientific American předplatitel od mých 12 let a pomohlo mi to utvářet můj pohled na svět. SciAm vždy mě vzdělává a těší a vzbuzuje úctu k našemu obrovskému, krásnému vesmíru. Doufám, že to udělá i vám.

Pokud vy přihlásit se k odběru Scientific Americanpomáháte zajistit, aby se naše pokrytí soustředilo na smysluplný výzkum a objevy; že máme zdroje na podávání zpráv o rozhodnutích, která ohrožují laboratoře v USA; a že podporujeme začínající i pracující vědce v době, kdy hodnota samotné vědy příliš často zůstává nepoznaná.

Na oplátku získáte zásadní zprávy, strhující podcastyskvělá infografika, nepřehlédnutelné newsletteryvidea, která musíte vidět, náročné hrya nejlepší vědecké psaní a zpravodajství. Můžete dokonce darovat někomu předplatné.

Nikdy nebyl důležitější čas, abychom vstali a ukázali, proč na vědě záleží. Doufám, že nás v této misi podpoříte.

Zdrojový odkaz

Lucie Tomanová 6 listopadu, 2025

0 3 minutes read

Umělá inteligence dekóduje vizuální aktivitu mozku – a píše k ní titulky

O podpoře vědecké žurnalistiky

Skenujte a předvídejte

Čtení budoucnosti

Je čas postavit se za vědu

Lucie Tomanová

Jessica Simpson oznamuje spolupráci se slavnou značkou po více než 20 letech od ohromujícího momentu televizní reality

Somálský ministr obviňuje podporu SAE z „fragmentace“ Somálska | Konflikt

Calif. College of Arts zavřít, prodat kampus Vanderbiltovi

Žádná poptávka po zdrojovém kódu, říkají výrobci telefonů

Nejméně 32 mrtvých po pádu jeřábu na vlak v Thajsku

Ochrana údajů Američanů z Číny je ústřední pro první agendu Ameriky

Přednášející BBC odstoupí z pořadu po Alzheimerově diagnóze, když vydávají srdcervoucí prohlášení

Papež, aby zůstal hospitalizován s infekcí dýchacích cest-NBC 5 Dallas-Fort Worth

Vysokoškolský student Jaren Barajas porazil Damiana Lillarda ve 3-bodové střelecké soutěži, vyhrál 100 000 $

Pořádek ostrovů, šéfové a další

Předpovídání Dubois v Parker, Beterbiev v Bivol 2 a každého vítěze tento víkend

O podpoře vědecké žurnalistiky

Skenujte a předvídejte

Čtení budoucnosti

Je čas postavit se za vědu

Subscribe to our mailing list to get the new updates!

Keir Starmer prolomil mlčení o nejnovější bombě Andrew Mountbatten | Royal | Zprávy

Liverpool OČEKÁVÁ, že smlouva bude brzy podepsána a zpečetěna

Related Articles

Ochrana údajů Američanů z Číny je ústřední pro první agendu Ameriky

Přednášející BBC odstoupí z pořadu po Alzheimerově diagnóze, když vydávají srdcervoucí prohlášení

Papež, aby zůstal hospitalizován s infekcí dýchacích cest-NBC 5 Dallas-Fort Worth

Vysokoškolský student Jaren Barajas porazil Damiana Lillarda ve 3-bodové střelecké soutěži, vyhrál 100 000 $

Pořádek ostrovů, šéfové a další

Předpovídání Dubois v Parker, Beterbiev v Bivol 2 a každého vítěze tento víkend