Umělá inteligence nyní analyzuje jazyk stejně jako lidské experty

Umělá inteligence (AI) systémy vykazují neočekávanou sílu v jazykové analýze a provádějí úkoly, které byly dříve považovány za jedinou doménu lidských expertů. V nedávném testování velký jazykový model vyvinutý OpenAI prokázal schopnosti uvažování srovnatelné se schopnostmi vyškolených lingvistů – což naznačuje, že umělá inteligence nyní dokáže zvládat aspekty jazyka s přesností podobnou odbornému lidskému porozumění.
Nálezy pocházejí od a studie vedl Gašper Beguš z Kalifornské univerzity v Berkeley spolu s lingvistou Maksymilianem Dąbkowskim a Ryanem Rhodesem z Rutgers University.
Tým zkoumal, zda by velké jazykové modely (LLM) mohly jít nad rámec jednoduchého generování textu, aby skutečně analyzovaly jazykovou strukturu – což je úkol vyžadující dovednosti historicky omezené na lidi.
Model umělé inteligence odpovídá lingvistům ve složitých úlohách syntaxe
Výzkumníci testovali několik modelů se zaměřením na syntax, nejednoznačnost a fonologii. Jeden model, označovaný jako o1, vyčníval. Analyzoval větné struktury, identifikoval různé interpretace nejednoznačných frází a dokonce se zabýval složitými koncepty, jako je rekurze – kde jsou fráze vnořeny do jiných frází.
V jednom testu o1 rozložil větu do její vrstvené struktury a poté přidal hlubší úroveň rekurze, která odráží analytické metody používané postgraduálními studenty lingvistiky.
Beguš řekl, že výkon modelu zpochybnil stávající přesvědčení o tom, čeho může umělá inteligence dosáhnout lingvistický rozbor.
David Mortensen, počítačový lingvista z Carnegie Mellon University, který se studie nezúčastnil, poznamenal, že výsledky naznačují, že jazykové modely se přibližují skutečnému porozumění jazyku, nikoli pouze predikci na úrovni povrchu.
Nejednoznačnost a fonologie odhalují hloubku jazykových schopností AI
V jiném úkolu model řešil nejednoznačnost ve větě jako „Rowan krmil svého mazlíčka kuřetem“, čímž vznikly dvě různé syntaktické struktury – jedna interpretuje kuře jako domácího mazlíčka a druhá jako jídlo. Tom McCoy, lingvista z Yale University, řekl, že tento druh uvažování je pro stroje obvykle obtížný, protože vyžaduje znalosti zdravého rozumu.
Aby se modely nespoléhaly na zapamatovaná data, vytvořil tým sadu nových jazyků obsahujících 40 vynalezených slov. Při analýze těchto neznámých fonologických vzorců o1 správně identifikoval pravidlo zahrnující dýchací samohlásky následující za konkrétními souhláskami. Mortensen při kontrole výsledku uvedl, že přesná analýza modelu byla mnohem pokročilejší, než se očekávalo.
Výsledky vyvolávají širší otázky o tom, zda se výkon AI bude i nadále škálovat s více daty a výpočetním výkonem – nebo zda některé aspekty lidský jazyk jsou hluboce spjaty s biologií.



