Bývalý vědec Openai, Andrej Karpathy, je z dlouhodobého hlediska „Bearish on zesílení“

Fotografie souboru: Renomovaný výzkumný pracovník AI a bývalý vědec OpenAI Andrej Karpathy uvedl, že je dlouhodobě „Bearrish on posilovací učení“, v příspěvku na X. | Foto kredit: Reuters
Výzkumný pracovník AI AI a bývalý vědec OpenAI Andrej Karpathy v postu X uvedl, že je dlouhodobě „medvědí na učení“, protože se ukáže jako neefektivní a obtížně navrhnout. Pan Karpathy, který byl jedním ze zakládajícího člena OpenAI a pracoval na modelu GPT-4, uvedl, že věří, že nové metody učení, podobné tomu, jak si lidé myslí, nakonec nahradí učení posílení.
„Osobně a v dlouhodobém horizontu jsem býčí v oblasti prostředí a agentických interakcí, ale já jsem medvědí na posilovacím učení konkrétně,“ řekl. Vyjádřil své pochybnosti, že lidé používali učení posílení pro většinu intelektuálních úkolů s výjimkou „některých motorových úkolů“.
„Lidé používají různá paradigma učení, která jsou výrazně silnější a efektivní vzorky a která ještě nebyla řádně vynalezena a upravena, i když existují časné náčrtky a nápady,“ dodal.
Jak se současná vlajková loď velkých jazykových modelů zpomaluje, došlo k oživení metod posílení učení – techniku školení strojového učení, která se používá k vytváření modelů AI.
Pan Karpathy poznamenal, že minulé techniky tréninku AI, jako je čtení textu a napodobování příkladů, budou i nadále existovat, ale budoucnost bude v provolování modelů žít v prostředích a učit se vzájemnou interakcí.
Publikováno – 29. srpna 2025 02:09



