věda

Aktualizace kurzoru aktualizuje model automatického doplňování pro lepší návrhy kódování

Fotografie souboru: Kurzor provedl vylepšení svého modelu Tab nebo systému, který naznačuje změny kódu pro vývojáře napříč soubory pomocí online výztužného učení. | Foto kredit: Reuters

Cursor uvedl, že provedli vylepšení svého modelu Tab nebo systému, který navrhuje změny kódu pro vývojáře napříč soubory pomocí online výztužného učení.

Platforma AI kódování oznámila aktualizaci X a uvedla, že model nyní uvádí „o 21% méně návrhů než předchozí model, zatímco má za návrhy, které předkládá.“

Blog zveřejněný kurzorem vysvětlil, jak se to stalo. Posílení učení funguje prostřednictvím odměn, kde agent prochází zkouškami a chybami několikrát v prostředí, aby maximalizoval kumulativní odměny.

Blog však poznamenal, že občas nebylo dost informací pro agenta, aby věděl, jakou akci bude uživatel podniknout; Takže i kdyby byl model vyroben technicky „chytřejší“, stále by to nevědělo, co dělat.

V takových situacích by bylo jednoduše lepší, kdyby model nedal žádné návrhy, místo nepřesného návrhu, který by mohl vykolejit vývojáře pracujícího na kódu.

„Metody gradientu politiky jsou obecným způsobem, jak optimalizovat„ politiku “(v tomto případě model Tab) ke zvýšení„ odměny “, uvedl blog. Odměna je číslo přiřazené ke každé akci, kterou provedl model Tab.

„Použitím algoritmu politického gradientu můžeme politiku aktualizovat tak, aby v budoucnu získala vyšší průměrnou odměnu,“ poznamenal.

Jakékoli přijaté návrhy z TAB byly tedy odměněny, zatímco nebyly odrazovány nezpůsobilé návrhy, které na Tab odradilo, což nakonec systém vylepšilo.

Začátkem června spustil Cursor webovou aplikaci pro uživatele, aby spravovali kódovací agenty přímo z jejich prohlížečů.

Zdrojový odkaz

Related Articles

Back to top button