Google představuje použití počítače Gemini 2.5 pro prohlížení webu

Fotografie souboru: Google představil nový model AI s názvem Počítač Gemini 2.5, který může navigovat a surfovat na webu pomocí virtuálního prohlížeče a dokonce provádět úkoly, jako jsou vyplňování formulářů. | Foto kredit: Reuters
Google představil nový model AI s názvem Počítač Gemini 2.5, který může navigovat a surfovat na webu pomocí virtuálního prohlížeče a dokonce provádět úkoly, jako jsou vyplňování formulářů. Model AI, postavený na Gemini 2.5 Pro, má „vizuální schopnosti porozumění a uvažování“ a pouze bere narážky z uživatelské výzvy.
„Zatímco modely AI se mohou propojit se softwarem prostřednictvím strukturovaných API, mnoho digitálních úkolů stále vyžaduje přímou interakci s grafickými uživatelskými rozhraními, například naplnění a odesílání formulářů. Pro splnění těchto úkolů musí agenti navigovat webové stránky a aplikace stejně jako lidé: kliknutím, psaním a posuzováním,“ uvedl oznámení blogu.
Uživatelé mohou přímo testovat a navigovat rozhraní bez použití API.
Jsou povinni poskytovat vstupy včetně obrazovky prostředí, historie nedávných akcí a jakýchkoli funkcí, které chtějí zahrnout. Model AI tyto pokyny analyzuje a při provádění akce generuje odpověď.
Google také uvedl, že model AI má přístup pouze k prohlížeči a nikoli do celého počítačového prostředí.
Model použití počítače Gemini 2.5 také prokázal srovnatelný výkon pro mobilní kontrolní úkoly uživatelského rozhraní, ale není „optimalizován pro ovládání na úrovni OS na ploše“.
Vývojáři mají přístup k modelu používání počítače Gemini 2.5 prostřednictvím API Gemini v Google AI Studio a Vertex AI.
Jiné verze modelu již byly použity pro Project Mariner, prototyp, který používá agenty AI pro úkoly, a pro některé agentické schopnosti v režimu AI při vyhledávání.
Publikováno – 8. října 2025 01:32 IS IS



