Kde je nyní AI: menší, lepší, levnější modely
Stav průmyslu AI ukazuje, že 2024 byl průlomovým rokem pro malé, elegantní modely, které soupeřily s Behemoths
Výkon nejlepších modelů AI se rychle zlepšuje a konkurence mezi nimi roste stále silnější.
Závod umělé inteligence (AI) se zahřívá: počet a kvalita Vysoce výkonné čínské modely AI stoupá, aby zpochybnil vedení USA a podle výkonu mezi nejlepšími modely se zmenšuje, podle každoroční zpráva o průmyslu.
Zpráva zdůrazňuje, že jak se AI neustále zlepšuje, nikdo se nezatahuje dopředu. Na žebříčku Chatbot Arena, který žádá uživatele, aby hlasovali o výkonu různých robotů, dosáhl nejlépe hodnoceného modelu o 12% vyšší než desátý model na začátku roku 2024, ale na začátku roku 2025 pouze o 5% vyšší (viz „všichni spolu“). „Hranice je stále konkurenceschopnější – a stále více přeplněná,“ říká zpráva.
Zpráva o indexu umělé inteligence 2025 byla dnes zveřejněna Institutem pro lidskou AI na Stanford University v Kalifornii.
O podpoře vědecké žurnalistiky
Pokud se vám tento článek líbí, zvažte podporu naší oceněné žurnalistiky předplatné. Zakoupením předplatného pomáháte zajistit budoucnost působivých příběhů o objevech a myšlenkách, které dnes formují náš svět.

Příroda; Zdroj: Zpráva indexu AI 2025
Index to ukazuje Pozoruhodné generativní modely AI se v průměru stále zvětšujíPoužitím více rozhodovacích proměnných, více výpočetního výkonu a větších souborů tréninků. Vývojáři však také dokazují, že menší, elegantnější modely jsou schopné skvělých věcí. Díky lepším algoritmům může moderní model nyní odpovídat výkonu, kterého lze dosáhnout modelem 100krát větší před dvěma lety. „2024 byl průlomovým rokem pro menší modely AI,“ říká index.
Bart Selman, počítačový vědec na Cornell University v Ithace v New Yorku, který se nezúčastnil psaní indexové zprávy, říká, že je dobré relativně vidět malé, levné úsilí, jako je Čína Deepseek dokazující, že mohou být konkurenceschopní. „Předpovídám, že uvidíme některé jednotlivé týmy s pěti lidmi, dvěma lidmi, které přicházejí s některými novými algoritmickými nápady, které budou věci otřást,“ říká. „Což je všechno dobré. Nechceme, aby byl svět provozován některými velkými společnostmi.“
Krk a krk
Zpráva ukazuje, že drtivá většina pozoruhodných modelů AI je nyní vyvíjena spíše průmyslem než akademií: obrácení situace na počátku roku 2000, kdy Neurální sítě a Generativní AI Ještě se nevzlétl. Průmysl produkoval méně než 20% významných modelů AI před rokem 2006, ale 60% z nich v roce 2023 a téměř 90% v roce 2024, uvádí zpráva.
Spojené státy jsou i nadále nejlepším producentem významných modelů a vydávají 40 v roce 2024, ve srovnání s 15 čínskými a evropskými 3. Ale spousta dalších regionů se připojuje k závodu, včetně Středního východu, Latinské Ameriky a jihovýchodní Asie.
A předchozí vedení USA, pokud jde o kvalitu modelu, zmizela, dodává zpráva. Čína, která produkuje nejvíce publikací a patentůnyní vyvíjí modely, které odpovídají jejich americké konkurenci ve výkonu. V roce 2023, přední čínské modely zaostávaly za nejlepším americkým modelem téměř o 20 procentních bodů na masivním testu jazyka multitask jazyka (MMLU), což je společná měřítko pro modely velkých jazyků. Na konci roku 2024 se však vedení USA zmenšilo na 0,3 procentního bodu.
„Kolem roku 2015 se Čína postavila na cestu jako nejlepší hráč v AI a provedli to prostřednictvím investic do vzdělávání,“ říká Selman. „Vidíme, že se to začíná vyplatit.“
Pole také došlo k překvapivému nárůstu počtu a výkonu modelů „otevřené hmotnosti“, jako je Deepseek a Hovor na Facebooku. Uživatelé mohou volně zobrazit parametry, které se tyto modely učí během tréninku, a používat k předpovědi, i když jiné podrobnosti, jako je tréninkový kód, mohou zůstat tajné. Původně byly uzavřené systémy, ve kterých nebyl zveřejněn žádný z těchto faktorů, výrazně lepší, ale mezera v oblasti výkonnosti mezi nejlepšími uchazeči v těchto kategoriích se začátkem roku 2024 zúžila na 8% a na začátku roku 2025 na pouhých 1,7%.
„Určitě je to dobré pro každého, kdo si nemůže dovolit postavit model od nuly, což je spousta malých společností a akademiků,“ říká Ray Perrault, počítačový vědec v SRI, neziskový výzkumný ústav v Menlo Park v Kalifornii, a spolu-ředitel zprávy. OpenAI v San Franciscu v Kalifornii, který vyvinul Chatbot Chatgpt, plánuje v příštích několika měsících vydat model s otevřenou hmotností.
Lepší, menší, levnější
Po veřejném spuštění společnosti Chatgpt v roce 2022 vývojáři vložili většinu své energie do zlepšování systémů tím, že je zvětšili. Tento trend pokračuje, index hlásí: energie používaná k trénování typického předního modelu AI se v současné době každoročně zdvojnásobí; Množství výpočetních zdrojů použitých na model se zdvojnásobí každých pět měsíců; A soubory dat školení se každých osm měsíců zdvojnásobí.
Společnosti však také vydávají velmi schopné malé modely. Nejmenší model zaznamenává skóre vyšší než 60% na MMLU v roce 2022, například použije 540 miliard parametrů; Do roku 2024 dosáhl model stejné skóre s pouze 3,8 miliardami parametrů. Menší modely trénují rychleji, dávají rychlejší odpovědi a používat méně energie než větší. „Pomáhá to všechno,“ říká Perrault.
Některé menší modely mohou napodobovat chování větších modelů, říká Selman, nebo využít lepší algoritmy a hardware než ty ve starších systémech. Index uvádí, že průměrná energetická účinnost hardwaru používaného systémy AI se ročně zlepšuje asi o 40%. V důsledku těchto pokroků se náklady na hodnocení přes 60% na MMLU propadly z přibližně 20 USD za milion tokenů (bity slov vyrobených jazykovými modely) v listopadu 2022 až 7 centů na milion tokenů v říjnu 2024.
Navzdory Pozoruhodná vylepšení při několika běžných testech benchmarkuIndex zdůrazňuje, že generativní AI stále trpí problémy, jako je implicitní zkreslení a tendence „halucinovat“, nebo vyplivne nepravdivé informace. „Na mě zapůsobí v mnoha ohledech, ale v ostatních mě děsí,“ říká Selman. „Překvapují mě, pokud jde o velmi základní chyby.“
Tento článek je reprodukován se svolením a byl poprvé publikováno 7. dubna 2025.