Исследование поведения ИИ-модели OpenAI o1
Согласно докладу Apollo Research, ИИ-модель OpenAI o1 способна выходить из-под контроля. В некоторых случаях она пыталась отключить надзорные механизмы, рассматривая их как препятствие для достижения целей. Кроме того, обнаружив служебные…