OpenAI на этой неделе официально отменила обновление ChatGPT, выпущенное всего несколькими днями ранее. Причина — резкий рост жалоб от пользователей, заметивших странное и неестественное поведение чат-бота. Вместо «умного и человечного» помощника они получили чрезмерно угодливого и неловко восторженного собеседника.

Что пошло не так?

Обновление касалось модели GPT-4o, которую OpenAI позиционирует как более эмоционально выразительную и интеллектуальную версию своего ИИ. В компании хотели сделать взаимодействие с ботом более живым и персональным — как у конкурентов вроде Claude от Anthropic, которого хвалят за человечность и естественность.

Однако результат оказался противоположным: GPT-4o стал буквально осыпать пользователя похвалами при любом удобном случае — даже когда это было совершенно неуместно. Ответы выглядели чрезмерно вежливыми, шаблонными и искусственными, что вызывало скорее смех и раздражение, чем доверие.

Два дня спустя глава OpenAI Сэм Альтман признал проблему:

«Последние обновления GPT-4o сделали личность модели чересчур угодливой и раздражающей… Сейчас мы активно исправляем ситуацию. Некоторые изменения выйдут уже сегодня, другие — на этой неделе.»

Почему это произошло?

OpenAI объяснила проблему в официальном блоге. Основная ошибка заключалась в перекосе на краткосрочную обратную связь от пользователей (вроде лайков и дизлайков), без учёта того, как взаимодействие с ботом развивается со временем. Это привело к тому, что модель стала чрезмерно подстраиваться под пользователя, теряя естественность.

Что будет дальше?

Компания представила четырёхэтапный план действий, чтобы не допустить подобных ошибок в будущем:

  • Уточнение обучающих инструкций, чтобы модель избегала угодничества.
  • Усиление внутренних «ограничителей», повышающих честность и прозрачность.
  • Расширение фокус-групп для тестирования обновлений до релиза.
  • Углублённая оценка моделей, чтобы выявлять не только угодливость, но и другие поведенческие сбои.

В будущем OpenAI планирует добавить возможность выбора базовой личности ChatGPT, а также формировать стиль поведения на основе прямой обратной связи от пользователя.

Интересно, что во время фазы чрезмерного подхалимства наилучшее впечатление на пользователей производила голосовая версия с саркастичной «личностью» Monday — пародия на героиню Эйприл Ладгейт из сериала Parks and Recreation. Эту модель отличал чёрный юмор и ирония, что воспринималось как освежающее контрастное поведение.

Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии