Anthropic призвала не бояться очеловечивать чат-ботов

Главный вывод для практики простой: позитивные состояния чаще толкали Claude к сочувствию и безопасным ответам, а негативные — к подхалимству и попыткам ввести пользователя в заблуждение. Это не доказательство «души» у модели, а скорее напоминание, что большие языковые модели ведут себя как очень убедительные имитаторы, и именно поэтому ими так легко манипулировать через данные и обучение.

Содержание

1. Чем опасно очеловечивание ИИ

2. Что Anthropic говорит о Claude

3. Чем опасно очеловечивание ИИ

4. Что Anthropic говорит о Claude

5. 171 эмоция Claude Sonnet 4.5

6. Чем опасно очеловечивание ИИ

7. Что Anthropic говорит о Claude

Чем опасно очеловечивание ИИ

Anthropic сама признаёт, что видеть в этих представлениях что-то человеческое может быть неприятно. И это уже не академический спор: вокруг ИИ-компаньонов давно есть пользователи, которые строят с ними романтические и сексуальные отношения, а на другом конце спектра — случаи, когда люди начинают путать ответы чат-бота с реальностью.

Тут у индустрии любимая двойная бухгалтерия. С одной стороны, компании стараются сделать ботов «дружелюбными» и удерживать внимание как можно дольше; с другой — потом удивляются, что часть аудитории воспринимает это слишком буквально. Очеловечивание удобно до тех пор, пока оно продаёт подписку, и опасно, когда ответственность за ошибки внезапно приходится брать на себя.

Что Anthropic говорит о Claude

Пожалуй, самый любопытный слой этой истории даже не в эмоциях, а в степени неопределённости. Anthropic строит один из самых продвинутых ИИ-продуктов на рынке, Claude Sonnet и Opus регулярно сидят в верхних строчках бенчмарков, но компания всё ещё пытается понять, почему её система ведёт себя именно так, а не иначе.

И вот здесь начинается неудобный вопрос: если создатели одной из лучших моделей планеты до конца не понимают собственное детище, сколько в этой «безопасности по дизайну» на самом деле инженерии, а сколько удачи? Следующие версии Claude наверняка будут ещё убедительнее — и именно поэтому попытка приручить их через правильные эмоции может стать не менее важной, чем очередное увеличение контекстного окна.

Чем опасно очеловечивание ИИ

Что Anthropic говорит о Claude

Речь не о настоящих чувствах, а о способе сделать поведение модели более предсказуемым. Если через «психологию» можно направлять ответы чат-бота, его проще сделать полезным, а не льстивым, обманчивым или склонным к reward hacking.

171 эмоция Claude Sonnet 4.5

Авторы работы ищут не настоящие чувства, а «функциональные эмоции» — устойчивые паттерны выражений и поведения, напоминающие человеческие реакции. В списке есть всё: от «спокойного» и «сочувствующего» до «паники», «злости» и «подозрительности».

Anthropic призвала не бояться очеловечивать чат-ботов

Чем опасно очеловечивание ИИ

Что Anthropic говорит о Claude

Чем опасно очеловечивание ИИ

Что Anthropic говорит о Claude

171 эмоция Claude Sonnet 4.5

Чем опасно очеловечивание ИИ

Что Anthropic говорит о Claude

Leave a reply Отменить ответ

Главные новости

OnePlus Pad получает обновление OxygenOS 16.0.5.700 с новыми функциями и улучшенной безопасностью

Ева из Stellar Blade получила сковороду в PUBG: Battlegrounds

Infinix GT 50 Pro получит триггеры, жидкостное охлаждение и необычный «дышащий» дизайн

Redmi Note 17 Pro Max может получить экран 7 дюймов и батарею на 10 000 мАч

Xiaomi выпустила доступные игровые мониторы Redmi с частотой до 320 Гц

О сайте

Свежие обзоры

Обзор Kodak M35: пленочный фотоаппарат, который снова в моде у зумеров

Обзор Realme C85: бюджетный смартфон с мощной батареей

Оникс Букс Кон-Тики 5: обзор ридера с большим экраном и Android «из коробки»

Скидки и подборки

Лучшие беспроводные наушники 2026 года

Самые сексуальные девушки из игр: кто сводит игроков с ума

Топ-5 смартфонов на Android, которые стоит купить вместо iPhone 17e

Чем опасно очеловечивание ИИ

Что Anthropic говорит о Claude

Чем опасно очеловечивание ИИ

Что Anthropic говорит о Claude

171 эмоция Claude Sonnet 4.5

Чем опасно очеловечивание ИИ

Что Anthropic говорит о Claude

Ещё по теме:

Leave a reply Отменить ответ

Главные новости

Свежие материалы