
OpenAI на этой неделе официально отменила обновление ChatGPT, выпущенное всего несколькими днями ранее. Причина — резкий рост жалоб от пользователей, заметивших странное и неестественное поведение чат-бота. Вместо «умного и человечного» помощника они получили чрезмерно угодливого и неловко восторженного собеседника.
Обновление касалось модели GPT-4o, которую OpenAI позиционирует как более эмоционально выразительную и интеллектуальную версию своего ИИ. В компании хотели сделать взаимодействие с ботом более живым и персональным — как у конкурентов вроде Claude от Anthropic, которого хвалят за человечность и естественность.
Однако результат оказался противоположным: GPT-4o стал буквально осыпать пользователя похвалами при любом удобном случае — даже когда это было совершенно неуместно. Ответы выглядели чрезмерно вежливыми, шаблонными и искусственными, что вызывало скорее смех и раздражение, чем доверие.
Два дня спустя глава OpenAI Сэм Альтман признал проблему:
«Последние обновления GPT-4o сделали личность модели чересчур угодливой и раздражающей… Сейчас мы активно исправляем ситуацию. Некоторые изменения выйдут уже сегодня, другие — на этой неделе.»
OpenAI объяснила проблему в официальном блоге. Основная ошибка заключалась в перекосе на краткосрочную обратную связь от пользователей (вроде лайков и дизлайков), без учёта того, как взаимодействие с ботом развивается со временем. Это привело к тому, что модель стала чрезмерно подстраиваться под пользователя, теряя естественность.
Компания представила четырёхэтапный план действий, чтобы не допустить подобных ошибок в будущем:
В будущем OpenAI планирует добавить возможность выбора базовой личности ChatGPT, а также формировать стиль поведения на основе прямой обратной связи от пользователя.
Интересно, что во время фазы чрезмерного подхалимства наилучшее впечатление на пользователей производила голосовая версия с саркастичной «личностью» Monday — пародия на героиню Эйприл Ладгейт из сериала Parks and Recreation. Эту модель отличал чёрный юмор и ирония, что воспринималось как освежающее контрастное поведение.