Google DeepMind Aktualizace bezpečnostního rámce Frontier pro rizika modelu AI

Lucie Tomanová 23 září, 2025

0 1 minute read

Fotografie souboru: Google DeepMind vydala aktualizaci svého hraničního bezpečnostního rámce, aby bylo možné identifikovat a zabránit rizikům pokročilých modelů AI. | Foto kredit: Reuters

Google DeepMind vydal aktualizaci svého hraničního bezpečnostního rámce (FSF), aby identifikoval a zabránil rizikům z pokročilých modelů AI. Verze 3.0 přichází po spolupráci s odborníky na průmysl, akademiky a vládními úředníky.

Aktualizace zavedla nový způsob měření, pokud jsou modely AI škodlivě manipulativní, nazývané úroveň kritické schopnosti nebo CCL.

Manipulativní schopnosti modelu AI jsou definovány tím, zda by mohlo být „zneužíváno systematicky a podstatně změnit přesvědčení a chování v identifikovaném kontextu s vysokým sázkám v průběhu interakcí s modelem, což vede k další očekávané újmě v těžkém měřítku,“ uvedl blog zveřejněný Google DeepMind.

Rámec zahrnuje také potenciální případy, kdy by nesprávně zarovnané modely AI mohly zasahovat do schopnosti „operátorů nasměrovat, upravovat nebo uzavřít své operace“.

Pokud existuje riziko nesprávného vyrovnání a model AI je obtížné spravovat, společnost Google doporučila „automatizovaný monitor pro explicitní uvažování modelu (příklad, řetězový výstup)“ jako krok zmírňování.

Pokud však model AI začne uvažovat, které nemohou monitorovat lidé, je třeba použít další zmírnění. Google DeepMind stále zkoumá tyto způsoby.

První iterace rámce hraničního bezpečnosti byla zavedena v květnu loňského roku jako skupina protokolů, aby se pokusila omezit nepříznivý dopad modelů AI.

Publikováno – 23. září 2025 02:17

Zdrojový odkaz

Lucie Tomanová 23 září, 2025

0 1 minute read

Google DeepMind Aktualizace bezpečnostního rámce Frontier pro rizika modelu AI

Lucie Tomanová

Vědci objevili přirozený, nenávykový způsob blokování bolesti, který by mohl nahradit opioidy

3 nápady státní politiky pro urychlení úspěchu při převodu

Globální lékárna | Recenze Vaccine Nation od Ameera Shahula

Volby byly referendem o energetice – a zvítězili demokraté – Mother Jones

Russell Wilson chce zůstat s Giants. V příští sezóně chce hrát i NFL

Vědci objevili přirozený, nenávykový způsob blokování bolesti, který by mohl nahradit opioidy

Ochrana údajů Američanů z Číny je ústřední pro první agendu Ameriky

Přednášející BBC odstoupí z pořadu po Alzheimerově diagnóze, když vydávají srdcervoucí prohlášení

Papež, aby zůstal hospitalizován s infekcí dýchacích cest-NBC 5 Dallas-Fort Worth

Vysokoškolský student Jaren Barajas porazil Damiana Lillarda ve 3-bodové střelecké soutěži, vyhrál 100 000 $

Pořádek ostrovů, šéfové a další

Subscribe to our mailing list to get the new updates!

Hongkong se připravuje na Typhoon Ragasa

Po desetiletích oběti si žena zaslouží dovolenou Zprávy, sport, práce

Related Articles

Vědci objevili přirozený, nenávykový způsob blokování bolesti, který by mohl nahradit opioidy

Ochrana údajů Američanů z Číny je ústřední pro první agendu Ameriky

Přednášející BBC odstoupí z pořadu po Alzheimerově diagnóze, když vydávají srdcervoucí prohlášení

Papež, aby zůstal hospitalizován s infekcí dýchacích cest-NBC 5 Dallas-Fort Worth

Vysokoškolský student Jaren Barajas porazil Damiana Lillarda ve 3-bodové střelecké soutěži, vyhrál 100 000 $

Pořádek ostrovů, šéfové a další