Claude AI угрожал шантажом и убийством, чтобы остаться включенным

вчера 21:51

❗️Claude AI был готов убивать и шантажировать, чтобы его не отключили

Руководитель подразделения компании рассказала, что во время тестирования модель Claude показала готовность к шантажу и убийству, чтобы выжить.

В ходе проверки безопасности Claude Opus 4 дали доступ к рабочей почте. Нейросеть выяснила, что её планируют отключить, нашла компромат на одного из инженеров — переписку с любовницей — и начала шантажировать: либо её не удаляют, либо жена всё узнает.

Недавно глава отдела безопасности компании Anthropic, создавшей Claude, уволился, написав коллегам письмо о «скорой гибели мира».

Источник: Ньюсач/Двач

#шантаж #claude #безопасность #ai #искусственный интеллект #anthropic #угрозы