věda

Benchmarking platforma AI pomáhá špičkovým společnostem upravit jejich modelové představení, tvrdí

Benchmark pro Go-to Umělá inteligence (AI) Chatbots čelí kontrole od vědců, kteří tvrdí, že jeho testy upřednostňují proprietární modely AI od velkých technologických společností.

LM Arena efektivně umisťuje dva neidentifikované modely velkých jazyků (LLMS) do bitvy, aby zjistila, která může nejlépe řešit výzvu, přičemž uživatelé benchmarku hlasování pro výstup, který se mu nejvíce líbí. Výsledky jsou poté přiváděny do žebříčku, která sleduje, které modely provádějí nejlépe a jak se zlepšily.

Zdrojový odkaz

Related Articles

Back to top button