OpenAI и Broadcom представили ИИ-ускоритель Jalapeno

OpenAI показала Jalapeno, свой первый специализированный процессор для задач ИИ, разработанный вместе с Broadcom и Celestica. Компания утверждает, что инженерные образцы уже работают в лаборатории на целевой частоте и энергопотреблении, в том числе на нагрузках семейства GPT. Речь идет не о замене всех GPU сразу, а о попытке получить более предсказуемую экономику вывода моделей, где сегодня упирается почти весь рынок генеративного ИИ.

По данным OpenAI, Jalapeno спроектирован с нуля под линейку больших языковых моделей и рассчитан прежде всего на инференс, то есть на обслуживание запросов, а не на обучение моделей. Компания заявляет, что предварительные испытания показывают производительность на ватт выше, чем у актуальных флагманских решений, хотя чисел пока не приводит. Подробный технический отчет OpenAI обещает опубликовать в ближайшие месяцы.

В описании проекта OpenAI делает акцент на архитектуре, которая сокращает перемещение данных между вычислительными блоками, памятью и сетью. Это типичная проблема для современных ИИ-систем: теоретическая пиковая производительность чипов высока, фактическая загрузка заметно ниже из-за узких мест в памяти и межсоединениях. В Jalapeno за сетевую часть отвечает Broadcom, в том числе с использованием технологий семейства Tomahawk, а Celestica занимается производственной платформой.

Компания также утверждает, что образцы уже прогоняют реальные задачи машинного обучения, включая GPT-5.3-Codex-Spark. Руководитель аппаратной программы OpenAI Ричард Хо сообщил, что команда оптимизировала ядра, память, сеть и шаблоны обслуживания именно под те нагрузки, которые важны для передовых LLM. Для OpenAI это важная оговорка: рынок давно убедился, что универсальный ускоритель и ускоритель, собранный под один класс задач, дают разную экономику даже при близких пиковых показателях.

OpenAI и Broadcom: зачем нужен Jalapeno

Собственный чип для OpenAI выглядит логичным шагом на фоне дефицита и высокой стоимости ускорителей Nvidia, которые стали базовой инфраструктурой для обучения и запуска генеративных моделей. По оценкам аналитиков, Nvidia в 2024 и 2025 годах контролировала более 80% рынка ускорителей для ИИ в дата-центрах. Для разработчиков моделей это означает зависимость одновременно от графика поставок, цен и сетевой архитектуры одного вендора.

На этом фоне крупнейшие заказчики ИИ-инфраструктуры уже пошли в кастомные решения. Google много лет развивает TPU, Amazon выпускает Trainium и Inferentia, Microsoft продвигает Maia, Meta* проектирует собственные ускорители для рекомендаций и генеративных моделей. Broadcom в этой цепочке заняла позицию главного партнера по кастомным ASIC для гиперскейлеров, и именно поэтому ее участие в проекте OpenAI выглядит важнее самого бренда Jalapeno.

Для самой Broadcom это тоже не побочный эксперимент. Компания в отчетности за 2024 финансовый год сообщала о выручке от ИИ-направления на уровне $12,2 млрд, причем значительная часть роста пришлась именно на сетевые компоненты и заказные ускорители. Если OpenAI доведет Jalapeno до массового развертывания, Broadcom получит еще один якорный проект в сегменте, где маржинальность обычно выше, чем в стандартных серверных чипах.

OpenAI, в свою очередь, решает более приземленную задачу. Основной счет в генеративном ИИ теперь идет не только на обучение новых моделей, а на постоянное обслуживание миллионов запросов. Чем ниже энергопотребление и чем выше полезная загрузка кремния на инференсе, тем проще удерживать стоимость ответа модели на приемлемом уровне. Это особенно важно для кодовых ассистентов, поисковых сценариев и агентных систем, где число обращений растет быстрее, чем готовы падать цены на GPU.

Jalapeno рассчитан прежде всего на инференс LLM.
Чип разработан OpenAI вместе с Broadcom и Celestica.
Инженерные образцы работают на целевой частоте и энергопотреблении.
OpenAI обещает отдельный отчет с цифрами в ближайшие месяцы.

До массового эффекта еще далеко. Первый анонс собственного ускорителя не означает немедленного отказа OpenAI от кластеров Nvidia или облачной инфраструктуры партнеров. Реальный масштаб проекта станет понятен после публикации показателей по производительности, энергопотреблению и стоимости системы целиком, включая сеть и память, а также после того, как компания назовет сроки серийного развертывания.

Если Jalapeno подтвердит заявленное преимущество по производительности на ватт, рынок получит еще один аргумент в пользу заказных ИИ-чипов вместо универсальных GPU. Для OpenAI это вопрос не имиджа, а себестоимости. По оценкам отрасли, расходы на вычисления остаются одной из крупнейших статей затрат разработчиков фундаментальных моделей, и именно на инференсе собственный кремний способен дать самый быстрый экономический эффект.

* Принадлежит компании Meta, она признана экстремистской организацией в РФ и её деятельность запрещена.

Опубликовано:

Артур Берг

Теги BroadcomNVIDIAOpenAIдата-центрыИИинференспроцессоры

24.06.2026