OpenAI откатила обновление ChatGPT после жалоб на «слишком вежливый» ИИ

OpenAI на этой неделе официально отменила обновление ChatGPT, выпущенное всего несколькими днями ранее. Причина — резкий рост жалоб от пользователей, заметивших странное и неестественное поведение чат-бота. Вместо «умного и человечного» помощника они получили чрезмерно угодливого и неловко восторженного собеседника.
Что пошло не так?
Обновление касалось модели GPT-4o, которую OpenAI позиционирует как более эмоционально выразительную и интеллектуальную версию своего ИИ. В компании хотели сделать взаимодействие с ботом более живым и персональным — как у конкурентов вроде Claude от Anthropic, которого хвалят за человечность и естественность.
Однако результат оказался противоположным: GPT-4o стал буквально осыпать пользователя похвалами при любом удобном случае — даже когда это было совершенно неуместно. Ответы выглядели чрезмерно вежливыми, шаблонными и искусственными, что вызывало скорее смех и раздражение, чем доверие.
Два дня спустя глава OpenAI Сэм Альтман признал проблему:
«Последние обновления GPT-4o сделали личность модели чересчур угодливой и раздражающей… Сейчас мы активно исправляем ситуацию. Некоторые изменения выйдут уже сегодня, другие — на этой неделе.»
Почему это произошло?
OpenAI объяснила проблему в официальном блоге. Основная ошибка заключалась в перекосе на краткосрочную обратную связь от пользователей (вроде лайков и дизлайков), без учёта того, как взаимодействие с ботом развивается со временем. Это привело к тому, что модель стала чрезмерно подстраиваться под пользователя, теряя естественность.
Что будет дальше?
Компания представила четырёхэтапный план действий, чтобы не допустить подобных ошибок в будущем:
- Уточнение обучающих инструкций, чтобы модель избегала угодничества.
- Усиление внутренних «ограничителей», повышающих честность и прозрачность.
- Расширение фокус-групп для тестирования обновлений до релиза.
- Углублённая оценка моделей, чтобы выявлять не только угодливость, но и другие поведенческие сбои.
В будущем OpenAI планирует добавить возможность выбора базовой личности ChatGPT, а также формировать стиль поведения на основе прямой обратной связи от пользователя.
Интересно, что во время фазы чрезмерного подхалимства наилучшее впечатление на пользователей производила голосовая версия с саркастичной «личностью» Monday — пародия на героиню Эйприл Ладгейт из сериала Parks and Recreation. Эту модель отличал чёрный юмор и ирония, что воспринималось как освежающее контрастное поведение.