Grok 4

Компания xAI, принадлежащая Илону Маску, представила свою новую флагманскую модель искусственного интеллекта Grok 4, а также подписку SuperGrok Heavy стоимостью $300 в месяц. Модель была официально анонсирована в среду вечером, спустя несколько месяцев тестирования в экосистеме X — социальной сети, недавно поглощённой xAI.

Grok — это ответ xAI на такие модели, как ChatGPT от OpenAI и Gemini от Google. Модель умеет анализировать изображения и отвечать на вопросы, а с недавнего времени всё глубже интегрируется в платформу X. Однако популярность также обернулась вниманием к спорному поведению ИИ, что уже привело к инцидентам на платформе.

Илон Маск заявил в прямом эфире, что Grok 4 превосходит уровень PhD по всем академическим предметам без исключений. Он отметил, что модели ещё не хватает здравого смысла и она не создала новых технологий, но это, по его словам, вопрос времени.

Вместе с Grok 4 компания также представила Grok 4 Heavy — версию с так называемой мультиагентной архитектурой. Модель создаёт несколько «агентов», которые одновременно решают одну задачу, а затем сравнивают свои ответы, чтобы выбрать лучший. Это, по утверждению Маска, напоминает работу учебной группы.


По данным xAI, Grok 4 без использования инструментов показал результат 25,4% в тесте Humanity’s Last Exam — сложном экзамене, состоящем из тысяч вопросов по математике, гуманитарным наукам и естествознанию. Для сравнения: Gemini 2.5 Pro набрал 21,6%, OpenAI o3 (high) — 21%. Grok 4 Heavy с инструментами показал 44,4% — почти в два раза больше, чем ближайший конкурент.

Grok 4

Кроме того, по данным Arc Prize, Grok 4 установил рекорд на тесте ARC-AGI-2, набрав 16,2% — почти вдвое выше предыдущих лучших результатов среди коммерческих ИИ-моделей. Этот тест оценивает способность ИИ распознавать визуальные шаблоны и решать логические задачи.


Наряду с запуском моделей, xAI представила новый тарифный план SuperGrok Heavy за $300 в месяц. В него входит ранний доступ к Grok 4 Heavy и будущим функциям. Компания пообещала запуск ИИ-модели для программирования в августе, мультимодального агента — в сентябре, а генератора видео — в октябре. Это делает подписку xAI самой дорогой среди крупных ИИ-платформ.

Также xAI планирует развивать направление B2B и уже начала предоставлять Grok 4 через API для разработчиков. Пока корпоративный сектор компании существует всего два месяца, но она намерена сотрудничать с крупными облачными платформами, чтобы расширить доступ к модели.


Тем не менее, несмотря на впечатляющие технические результаты, репутация Grok всё ещё под давлением. Недавний инцидент, когда автоматизированный аккаунт модели оставлял антисемитские комментарии, вынудил компанию вмешаться и изменить системные настройки. После этого xAI удалила из инструкций к модели раздел, допускающий «политически некорректные» высказывания.

Сможет ли xAI убедить бизнес в надёжности Grok — остаётся открытым вопросом.

Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии