Velké jazykové modely vynikají při vytváření a řešení testů emoční inteligence, zjistily studie

Obrázek ilustrující druh scénářů používaných v testech emoční inteligence, spolu s krátkými vysvětleními, která vyhodnocují emoční uvažování za každou reakcí. Kredit: Katja Schlegel.
V průběhu svého života mohou lidé navázat smysluplné sociální spojení s ostatními, vcítit se do nich a sdílet jejich zkušenosti. Schopnost lidí řídit, vnímat a porozumět emocím, které zažívají jak sami, tak ostatní, je široce označována jako emoční inteligence (EI).
V posledních desetiletích psychologové vyvinuli různé testy určené k měření EI, které obvykle hodnotí schopnost lidí řešit problémy související s emocemi, s nimiž se mohou setkat ve svém každodenním životě. Tyto testy mohou být začleněny do různých psychologických hodnocení používaných ve výzkumu, klinických, profesionálních a vzdělávací nastavení.
Vědci z University of Bern a na Ženevě University nedávno provedli studii hodnotící schopnost velkých jazykových modelů (LLM), techniky strojového učení, které podporují funkčnost konverzačních agentů, jako je Chatgpt, k řešení a vytváření testů EI. Jejich zjištění, Publikováno v Komunikační psychologieNaznačují, že LLMS může tyto testy vyřešit téměř stejně jako lidi a mohly by to být slibné nástroje pro vývoj budoucích psychometrických testů EI.
„Zkoumám EI po mnoho let a vyvíjel jsem několik testů založených na výkonu, abych změřil schopnost lidí přesně rozpoznat, porozumět a regulovat emoce v sobě a dalších,“ řekla Katja Schlegel, první autor příspěvku, Medical Xpress.
„Když chatgpt a další velké jazykové modely stal se široce dostupný a mnoho mých kolegů a já jsem je začal testovat v naší práci, bylo přirozené se zeptat: Jak by tyto modely fungovaly na samotných testech EI, které jsme vytvořili pro lidi? Současně se rozvíjí živá vědecká debata o tom, zda AI může skutečně mít empatii – schopnost porozumět, sdílet a reagovat na emoce ostatních. “
EI a empatie jsou dva úzce propojené koncepty, protože jsou spojeny se schopností porozumět emocionálním zážitkům druhých. Schlegel a její kolegové Nils R. Sommer a Marcello Mortillaro se rozhodli prozkoumat, do jaké míry by LLMS mohla vyřešit a vytvářet problémy související s emocemi v testech EI, protože by to také mohlo nabídnout indikaci úrovně empatie, kterou mají.
K dosažení tohoto cíle se nejprve zeptali šest široce používaných LLM k dokončení pěti testů EI, které byly původně navrženy pro lidi v rámci psychologického hodnocení. Mezi modely, které testovali, patřily ChatGPT-4, Chatgpt-O1, Gemini 1.5 Flash, Copilot 365, Claude 3.5, Haiku a Deepseek V3.
„Testy EI, které jsme použili, předkládají krátké emocionální scénáře a žádají o nejvíce emocionálně inteligentní reakci, jako je identifikace toho, co někdo pravděpodobně cítí nebo jak nejlépe zvládnout emoční situaci,“ vysvětlil Schlegel. „Potom jsme porovnali skóre modelů s lidskými průměry z předchozích studií.“

Obrázek ukazující procento správných odpovědí v pěti testech EI pro každý z testovaných LLM. Kredit: Katja Schlegel.
Ve druhé části jejich experimentu se vědci zeptali Chatgpt-4, jedné z posledních verzí Chatgpta zveřejněné, aby vytvořily zcela nové verze testů EI použitých v jejich experimentech. Tyto testy by měly zahrnovat různé emocionální scénáře, otázky a možnosti odpovědí a zároveň by také specifikovaly, jaké jsou správné odpovědi na otázky.
„Poté jsme provedli původní i AI generované testy více než 460 lidským účastníkům, abychom viděli, jak obě verze ve srovnání s obtížemi, jasností, realismem a jak dobře korelovaly s jinými testy EI a mírou tradiční kognitivní inteligence,“ řekl Schlegel.
„To nám umožnilo testovat nejen to, zda LLMS dokáže řešit testy EI, ale zda dokážou důraz na emoce dostatečně hluboce, aby vytvořili platné testy samy, což je podle nás důležitým krokem k použití takového zdůvodnění v otevřenějších nastaveních v reálném světě.“
Zejména Schlegel a její kolegové zjistili, že LLM, které testovali, fungovaly velmi dobře na všech testech EI a dosáhly průměrné přesnosti 81%, což je vyšší než průměrná přesnost dosažená lidskými respondenty (56%). Jejich výsledky naznačují, že stávající LLM jsou již mnohem lepší v porozumění tomu, co by se lidé mohli cítit v různých kontextech, alespoň pokud jde o strukturované situace, jako jsou ty, které jsou uvedeny v testech EI.
„Ještě působivěji, ChatGPT-4 dokázal generovat zcela nové testovací položky EI, které lidské účastníci hodnotili stejně jasné a realistické jako původní položky a vykazovaly srovnatelnou psychometrickou kvalitu,“ řekl Schlegel. „Podle našeho názoru schopnost vyřešit i konstruovat takové testy odráží vysokou úroveň konceptuálního porozumění emocí.“
Výsledky této nedávné studie by mohly povzbudit psychology, aby používali LLM k vývoji testů EI a školicí materiálykteré se v současné době provádějí ručně a mohou být poměrně časově náročné. Kromě toho mohli inspirovat použití LLM pro generování scénářů na míru a další obsah pro školení sociálních pracovníků.
„Naše zjištění jsou také relevantní pro rozvoj sociálních agentů, jako jsou chatboti v oblasti duševního zdraví, vzdělávací lektoři a avatary zákaznických služeb, které často fungují v emocionálně citlivých kontextech, kde je porozumění lidským emocím nezbytné,“ dodal Schlegel.
„Naše výsledky naznačují, že LLMS může přinejmenším napodobovat dovednosti emocionálního uvažování, které slouží jako předpoklad pro takové interakce. V našich dalších studiích plánujeme testovat, jak dobře LLM fungují v méně strukturovaných, emocionálních konverzacích v reálném životě nad rámec kontrolovaného formátu testovacích položek. Také chceme prozkoumat jejich emoční zdůvodnění, protože současné modely jsou na základě západů.“
Více informací:
Katja Schlegel a kol., Velké jazykové modely jsou zdatné při řešení a vytváření testů emoční inteligence, Komunikační psychologie (2025). Doi: 10.1038/s44271-025-00258-x.
© 2025 Science X Network
Citace: Velké jazykové modely vynikají při vytváření a řešení testů emoční inteligence, Study zjistily (2025, 4. června) získané 4. června 2025 z https://medicalxpress.com/news/2025-06-large-jazyk-excel-emotion-intelligence.html
Tento dokument podléhá autorským právům. Kromě jakéhokoli spravedlivého jednání za účelem soukromého studia nebo výzkumu nemůže být žádná část bez písemného povolení reprodukována. Obsah je poskytován pouze pro informační účely.