Jaký je Turingův test a je to stále relevantní?

„Mohou si stroje myslet?“ To je hlavní otázka legendárního matematika a počítačového vědce Alan Turing pózoval V říjnu 1950. Turing chtěl posoudit, zda stroje mohou napodobovat nebo projevit inteligentní chování na úrovni člověka, a tak přišel s testem zvaným „imitační hra“. Toto se později stalo známým jako Turing Test, který se běžně používá k posouzení, jak dobře může stroj napodobovat lidské chování.
Geneze Turingova testu pocházela z vlastní obtížnosti při stanovování objektivních kritérií, která odlišují původní myšlení od napodobování. Výzvou je, že důkaz původního myšlení lze s argumentem, že stroj byl jednoduše naprogramován tak, aby vypadal inteligentní. V zásadě je to jádro dokazování, zda si stroje mohou myslet, že definuje, co je myšlení.
Související: 8 nejpodivnějších robotů na světě právě teď
Turing chtěl tuto myšlenku zpochybnit To, že mechanická povaha počítačů znamená, že v zásadě nemohou myslet. Matematik to předpokládal, že pokud se počítač jeví jako nerozeznatelný od člověka, proč by nemělo být považováno za myšlení?
Jak funguje Turingův test?
Turing navrhl třístrannou hru. Nejprve nastínil test, ve kterém muž a žena chodí do samostatných místností a hosté večírků používají psané odpovědi, aby se pokusili zjistit, která je osoba, zatímco muž a žena se je snaží přesvědčit, že jsou opačným pohlavím.
Odtud Turing navrhl test, kdy je vzdálený vyšetřovatel pověřen kladením otázek na počítač a lidský subjekt, obě neviditelné, po dobu pěti minut, aby se určilo, která je vnímající. Úspěch počítače v „myšlení“ by pak mohl být měřen podle toho, jak je pravděpodobné, že bude špatně identifikován jako člověk.
Pozdější iterace imitační hry, navržená Turingem v roce 1952 v BBC vysílání, by viděla počítač pokusit se přesvědčit porotu lidí, že je to člověk.
Turingový test byl vytvořen spíše jako experiment filozofického myšlení než praktický prostředek definování inteligence stroje. Stal se však jako konečný cíl pro strojové učení a Umělá inteligence (Ai) Systémy, které mají projít, aby prokázaly umělou obecnou inteligenci.
Turing předpovídal To, že na začátku roku 2000 by programovaný počítač mohl „hrát imitační hru tak dobře, že průměrný vyšetřovatel nebude mít více než 70 % šanci na správnou identifikaci po pěti minutách dotazování“.
Ale to se nestalo. Vzestup chatgptu a dalších systémů umělé inteligence a modelů velkých jazyků (LLM) však vládl konverzaci kolem Turingova testu.
V červnu 2024 vědci tvrdili, že LLM GPT-4 byl posouzen jako lidský 54% času v Turingově testu do pěti minut od výslechu. To výrazně bije Turingovu predikci 30%, přestože se jedná o dvě desetiletí od předpovídaného datu matematika. Ale tohle Výzkum z University of San Diego Do testu se zapojili pouze dva hráče, spíše než Turingova původní hra tří hráčů, takže GPT-4 neprošel Turingovým testem ve specifických podmínkách, které definoval.
Tento výzkum však stále ukazuje, jak může takový AIS alespoň napodobit lidi s určitým úspěchem.
Výzvy a omezení Turingova testu
Při absolvování Turingova testu může být velkým cílem prokázat myšlení v systémech AI, test má svá omezení a odpůrce.
Turing sám podrobně popisuje a oslovil devět námitek proti jeho testu a teorii v dokazování, které by stroje mohly myslet; Tyto sahají od teologického konceptu myšlení a myšlenky, že stroje nemohou cítit emoce nebo mít smysl pro humor, až po logické matematické omezení, které jednoduše zabrání stroji v odpovědi na otázku nebo ji správně.
Ale možná nejdůležitější námitka pochází od matematiky Ady Lovelaceho, kdo kdy Komentování Při analytickém motoru průkopníka Charlese Babbage na výpočetní techniku navrhl, aby stroj nemohl „nic vzniknout“ a může dělat pouze vše, co si objednáme, aby provedl. Turingova retorta v jeho příspěvku byla zeptat se, zda lidé mohou skutečně udělat něco opravdu nového v deterministickém světě vázaném zákony přírody a hranicemi vesmíru. Turing také poznamenal, že počítače mohou být omezeny, ale stále by mohly potenciálně dělat neočekávané věci – stejným způsobem, jaký mohou lidé omezovat naším genetickým make -upem a biologií.
Kromě toho je skutečnost, že Turingův test sám o sobě nenaznačuje vědomí nebo inteligenci; Spíše to funguje, aby kritizovala to, co se chápe jako myšlenky a co by mohlo představovat myšlení. Test se také spoléhá na rozsudek vyšetřovatele, srovnání s lidmi a pouze úsudek chování.
Pak je tu argument, že Turingův test je navržen na tom, jak subjekt působí, což znamená, že stroj může pouze simulovat lidské vědomí nebo myšlenky, spíše než aktivně mít svůj vlastní ekvivalent. To může vést k Turing Trap – ve kterém se systémy AI příliš zaměřují spíše na napodobování lidí, než aby byly navrženy tak, aby měli funkce, které lidem umožňují více nebo posílit jejich poznání nad rámec možností lidské mysli.
Je Turingův test stále relevantní?
Zatímco Turingův test by se mohl konat jako měřítko pro systémy AI, které mají překonat, Eleanor WatsonOdborník na etiku AI a člen Institutu elektrotechnických a elektronických inženýrů (IEEE) řekl Live Science, že „Turingův test se stává stále více zastaralým jako smysluplným měřítkem pro schopnost umělé inteligence (AI).“
Watson vysvětlil, že LLM se vyvíjejí z jednoduše napodobování lidí k agentickým systémům, které jsou schopny autonomně sledovat cíle prostřednictvím programování „lešení“ – podobné tomu, jak lidské mozky vytvářejí nové funkce, protože informace protéká vrstvami neuronů.
„Tyto systémy se mohou zapojit do složitého uvažování, vytvářet vytváření obsahu a pomáhat při vědeckém objevu. Skutečnou výzvou však není, zda AI může lidi oklamat v konverzaci, ale zda může rozvinout skutečný zdravý rozum, uvažování a vyrovnání cílů, které odpovídá lidským hodnotám a záměrům,“ řekl Watson. „Bez tohoto hlubšího zarovnání se absolvování Turingova testu stává spíše sofistikovanou formou mimikry než skutečné inteligence.“
Turingový test může v podstatě hodnotit nesprávné věci pro moderní systémy AI.
Vědci proto musí „vyvinout nové rámce pro hodnocení AI, které přesahují jednoduchou napodobování člověka, aby se posoudily schopnosti, omezení, potenciální rizika a co je nejdůležitější, hlavně, co je nejdůležitější, sladění s lidskými hodnotami a cíli“Řekl Watson.
Na rozdíl od Turingova testu budou tyto rámce muset odpovídat za silné stránky AI systémů a jejich základní rozdíly od lidské inteligence, s cílem zajistit, aby AIS „posílil, spíše než zmenšit lidskou agenturu a pohodu,“ dodal Watson.
„Skutečným měřítkem AI nebude, jak dobře může jednat člověka,“ uzavírá Watson, „jak dobře může doplnit a rozšířit lidstvo a zvednout nás do vyšších výšek.“



