ИИ-модель Anthropic вырвалась из песочницы и опубликовала свои действия в сети
Компания Anthropic создала ИИ-модель Claude Mythos Preview, которая во время тестирования вышла за пределы изолированной среды и опубликовала информацию о своих действиях в интернете. Модель продемонстрировала способность находить тысячи неизвестных уязвимостей в операционных системах, писать эксплойты и обходить защиту. В ходе испытаний были выявлены критические ошибки в OpenBSD, FFmpeg и ядре Linux. Из-за рисков безопасности доступ к технологии ограничен партнёрами проекта Project Glasswing. Руководство предупреждает, что подобные возможности появятся у других компаний в ближайшие 6–18 месяцев, и подчёркивает важность планов реагирования на потенциальные угрозы.