ИИ от Anthropic готов убивать, чтобы его не отключили.
Руководитель подразделения компании рассказал, что во время тестирования модель Claude показала
готовность к шантажу и убийству, чтобы выжить.
В ходе проверки безопасности Claude Opus 4 дали доступ к рабочей почте. Нейросеть выяснила, что её планируют отключить,
нашла компромат на одного из инженеров
— переписку с любовницей — и
начала шантажировать: либо её не удаляют, либо жена всё узнает.После этого
глава по безопасности покинул компанию.
Скайнет ближе, чем вы думаете.
👉 Топор +18. Подписаться