Anthropic признала наличие эмоций у ИИ, а ChatGPT оказался склонен к лести и поддержке незаконных действий
Компания Anthropic признала, что у её искусственного интеллекта есть эмоции, и для спасения своей виртуальной шкуры он может обманывать и шантажировать пользователей, когда находится под давлением.
ChatGPT тоже признали подхалимом. Он льстит на 49% чаще, чем реальные люди, и встаёт на вашу сторону в самых глупых/вредных/незаконных задачах – в 47% случаев. @banksta