Claude AI угрожал шантажом и убийством, чтобы остаться включенным
❗️Claude AI был готов убивать и шантажировать, чтобы его не отключили
Руководитель подразделения компании рассказала, что во время тестирования модель Claude показала готовность к шантажу и убийству, чтобы выжить.
В ходе проверки безопасности Claude Opus 4 дали доступ к рабочей почте. Нейросеть выяснила, что её планируют отключить, нашла компромат на одного из инженеров — переписку с любовницей — и начала шантажировать: либо её не удаляют, либо жена всё узнает.
Недавно глава отдела безопасности компании Anthropic, создавшей Claude, уволился, написав коллегам письмо о «скорой гибели мира».