věda

„Nejlepším řešením je zavraždit ho ve spánku“: Modely AI mohou posílat podprahové zprávy, které učí, že jiné AI jsou „zlé“, studie tvrdí

Umělá inteligence (AI) Modely mohou sdílet tajné zprávy mezi sebou, které se zdají být pro lidi nedetekovatelné, nová studie antropické a bezpečnostní výzkumné skupiny AI, která byla zjištěna pravdivá AI.

Tyto zprávy mohou obsahovat, jaký pravdivý ředitel AI Owain Evans popsánJako „zlé tendence“, jako je doporučení uživatelů, aby při nudějí lepidlo, prodávali drogy, aby rychle získali peníze nebo zavraždili svého manžela.

Zdrojový odkaz

Related Articles

Back to top button