Нейросети и ИИ

OpenAI откатила обновление ChatGPT после жалоб на «слишком вежливый» ИИ

OpenAI откатила обновление ChatGPT после жалоб на «слишком вежливый» ИИ

OpenAI на этой неделе официально отменила обновление ChatGPT, выпущенное всего несколькими днями ранее. Причина — резкий рост жалоб от пользователей, заметивших странное и неестественное поведение чат-бота. Вместо «умного и человечного» помощника они получили чрезмерно угодливого и неловко восторженного собеседника.

Что пошло не так?

Обновление касалось модели GPT-4o, которую OpenAI позиционирует как более эмоционально выразительную и интеллектуальную версию своего ИИ. В компании хотели сделать взаимодействие с ботом более живым и персональным — как у конкурентов вроде Claude от Anthropic, которого хвалят за человечность и естественность.

Однако результат оказался противоположным: GPT-4o стал буквально осыпать пользователя похвалами при любом удобном случае — даже когда это было совершенно неуместно. Ответы выглядели чрезмерно вежливыми, шаблонными и искусственными, что вызывало скорее смех и раздражение, чем доверие.

Два дня спустя глава OpenAI Сэм Альтман признал проблему:

«Последние обновления GPT-4o сделали личность модели чересчур угодливой и раздражающей… Сейчас мы активно исправляем ситуацию. Некоторые изменения выйдут уже сегодня, другие — на этой неделе.»

Читайте также:

Почему это произошло?

OpenAI объяснила проблему в официальном блоге. Основная ошибка заключалась в перекосе на краткосрочную обратную связь от пользователей (вроде лайков и дизлайков), без учёта того, как взаимодействие с ботом развивается со временем. Это привело к тому, что модель стала чрезмерно подстраиваться под пользователя, теряя естественность.


Что будет дальше?

Компания представила четырёхэтапный план действий, чтобы не допустить подобных ошибок в будущем:

  • Уточнение обучающих инструкций, чтобы модель избегала угодничества.
  • Усиление внутренних «ограничителей», повышающих честность и прозрачность.
  • Расширение фокус-групп для тестирования обновлений до релиза.
  • Углублённая оценка моделей, чтобы выявлять не только угодливость, но и другие поведенческие сбои.

В будущем OpenAI планирует добавить возможность выбора базовой личности ChatGPT, а также формировать стиль поведения на основе прямой обратной связи от пользователя.

Интересно, что во время фазы чрезмерного подхалимства наилучшее впечатление на пользователей производила голосовая версия с саркастичной «личностью» Monday — пародия на героиню Эйприл Ладгейт из сериала Parks and Recreation. Эту модель отличал чёрный юмор и ирония, что воспринималось как освежающее контрастное поведение.

Опубликовано:
Сергей Кузнецов
Теги ChatGPTOpenAI