OpenAI представила GPT-5.2

OpenAI представила свою новую флагманскую модель — GPT-5.2, выпуская её на фоне усиливающейся конкуренции с Google. Компания называет новинку самым продвинутым ИИ из всех своих разработок и ориентирует её как на разработчиков, так и на ежедневное профессиональное использование.

GPT-5.2 станет доступна платным пользователям ChatGPT и разработчикам через API в трёх версиях. Instant — оптимизированная по скорости модель для рутинных запросов: поиска информации, написания текстов и перевода. Thinking — модель, которая лучше справляется со сложной структурированной работой: программированием, анализом длинных документов, математикой и планированием. Pro — старшая версия, рассчитанная на максимальную точность и надёжность при решении трудных задач.

«Мы создали 5.2, чтобы дать людям ещё больше экономической ценности», — сказала Фиджи Симо, директор по продукту OpenAI, выступая перед журналистами. «Она лучше создаёт таблицы, собирает презентации, пишет код, анализирует изображения, понимает длинный контекст, работает с инструментами и связывает между собой сложные многоэтапные проекты».

Релиз GPT-5.2 происходит на фоне гонки вооружений с Google и его Gemini 3, лидирующим в рейтингах LMArena по большинству тестов (кроме кодинга — где до сих пор сильнее Anthropic Claude Opus-4.5).

В начале месяца издание The Information сообщило, что генеральный директор Сэм Альтман выпустил внутреннюю «красную тревогу» — меморандум, связанный со снижением трафика ChatGPT и опасениями, что сервис теряет аудиторию в пользу Google. В документе говорилось о смене приоритетов: отложить такие инициативы, как запуск рекламы, и сосредоточиться на улучшении пользовательского опыта.

GPT-5.2 — это попытка OpenAI вернуть лидерство, несмотря на сообщения, что некоторые сотрудники хотели отложить релиз, чтобы улучшить модель. И хотя часть планов OpenAI была направлена на развитие потребительских сценариев с персонализацией ChatGPT, запуск GPT-5.2 выглядит как усиление фокуса на корпоративных клиентах.

Компания явно делает ставку на разработчиков и экосистему инструментов, стремясь стать основной платформой для создания ИИ-приложений. Ранее на этой неделе OpenAI опубликовала новые данные, показывающие резкий рост корпоративного использования её инструментов за последний год.

Тем временем Gemini 3 всё глубже интегрируется в экосистему Google и Google Cloud, обеспечивая мультимодальные и агентные рабочие процессы. На этой неделе Google представила управляемые MCP-серверы, которые упрощают подключение агентов к таким сервисам, как Maps и BigQuery. (MCP — это система соединителей между ИИ и внешними данными и инструментами.)

По словам OpenAI, GPT-5.2 показывает новые рекорды в кодинге, математике, науке, компьютерном зрении, работе с длинным контекстом и использовании инструментов. Компания утверждает, что это позволит создавать более надёжные агентные рабочие процессы, производственный код и сложные системы, работающие с обширными данными и реальным контекстом.

Эти возможности ставят GPT-5.2 в прямую конкуренцию с Deep Think-режимом Gemini 3, который Google продвигает как серьёзный прорыв в области рассуждений — особенно в математике, логике и науке. На графиках OpenAI видно, что GPT-5.2 Thinking превосходит Gemini 3 и Anthropic Claude Opus 4.5 почти во всех тестах: от SWE-Bench Pro (инженерные задачи) и GPQA Diamond (уровень PhD в науках) до абстрактного мышления и поиска закономерностей (ARC-AGI).

Руководитель исследований Эдейн Кларк пояснил, что высокие результаты по математике — это не только умение решать уравнения. Математическое мышление — показатель того, насколько хорошо модель следует многошаговой логике, удерживает числовую точность и избегает мелких ошибок, которые могут накапливаться.

«Это всё крайне важно для разных задач», — сказал Кларк. «Например, финансовое моделирование, прогнозирование, анализ данных».

Руководитель продукта OpenAI Макс Шварцер отметил, что GPT-5.2 значительно улучшает генерацию и отладку кода и умеет пошагово объяснять сложную математику и логику. Стартапы Windsurf и CharlieCode, по его словам, фиксируют «передовое качество агентного программирования» и повышение эффективности в сложных многошаговых задачах.

Помимо программирования, Шварцер отметил, что ответы GPT-5.2 Thinking содержат на 38% меньше ошибок, чем у предыдущей версии. Это делает модель более надёжной для повседневных задач: принятия решений, исследований и написания текстов.

GPT-5.2 — не революция, а скорее развитие идей последних двух обновлений. GPT-5, вышедшая в августе, была «перезагрузкой», создающей единую систему с возможностью переключения между быстрым режимом и глубоким Thinking. GPT-5.1 в ноябре сделала модель более тёплой, разговорной и лучше подходящей для агентных сценариев и кодинга. GPT-5.2 усиливает эти тенденции, становясь более устойчивой базой для реального применения.

Ставки для OpenAI сейчас максимальные. Компания вложила около 1,4 триллиона долларов в развитие ИИ-инфраструктуры на ближайшие годы — эти обязательства она взяла на себя, когда ещё сохраняла преимущество первопроходца. Теперь же, когда Google заметно ускорился, эта ставка может объяснять «красную тревогу» Альтмана.

Фокус на моделях рассуждений также несёт риски. Thinking и Deep Research используют больше вычислительных ресурсов, чем обычные чат-модели. Усиливая упор на такие модели, OpenAI рискует попасть в замкнутый цикл: тратить больше ресурсов, чтобы выигрывать рейтинги, и ещё больше — чтобы поддерживать эти дорогие модели в работе.

По некоторым данным, затраты OpenAI на вычисления уже выше, чем компания заявляла ранее. Как писал TechCrunch, большую часть расходов на инференс — вычисления, необходимые для работы обученной модели — OpenAI оплачивает наличными, а не облачными кредитами. Это означает, что стоимость вычислений превысила уровень, который могли покрывать партнёрства.

При всём внимании к рассуждению, в сегодняшнем релизе нет новой модели генерации изображений. В мемо «красной тревоги» Альтман якобы называл изображение ключевым приоритетом — особенно после того, как Google Nano Banana (почти вирусная версия модели Gemini 2.5 Flash Image) получила большой резонанс после релиза в августе.

В прошлом месяце Google выпустила Nano Banana Pro (Gemini 3 Pro Image) — улучшенную версию с более точной передачей текста, усиленными знаниями о мире и пугающе реалистичными фото. Она также глубже интегрирована в продукты Google, как показывали примеры автоматической генерации презентаций через Google Labs Mixboard.

По сообщениям, OpenAI планирует релиз новой модели в январе — с улучшенной генерацией изображений, более высокой скоростью и улучшенной «личностью». Однако официального подтверждения в четверг компания не дала.

Также OpenAI заявила, что запускает новые меры безопасности, связанные с использованием ИИ в контексте психического здоровья и верификацией возраста подростков, но эти изменения не стали центральной темой презентации.

Источник: Techcrunch

Никита Брытков

Ведущий аналитик новостного отдела itzine.ru, подготовивший свыше 8000 публикаций по актуальным вопросам цифровой индустрии. Фокусируется на информационной безопасности, изменениях в работе глобальных IT-сервисов и вопросах конфиденциальности личных данных. Экспертиза включает мониторинг обновлений операционных систем, развитие технологий искусственного интеллекта и анализ взаимодействия крупнейших технологических корпораций.