Модель ИИ GLM-5.2 от Z.ai вышла в лидеры без чипов Nvidia

Карабас-барбос разговаривает с мужчиной в цилиндре и плаще

Китайская Z.ai выпустила открытую модель ИИ GLM-5.2 и сразу вывела её в верхние строчки отраслевых рейтингов. Компания утверждает, что всё семейство GLM-5 обучалось только на ускорителях Huawei Ascend 910B, без использования Nvidia. Для США это неприятный сигнал: экспортные ограничения на чипы не остановили китайскую лабораторию, а лишь сместили её на локальную аппаратную базу.

По данным самой компании, 17 июня Z.ai опубликовала веса модели под лицензией MIT и результаты бенчмарков. В индексе Artificial Analysis модель поднялась на первое место, а в Code Arena заняла второе место в общем зачёте и первое среди доступных моделей. На SWE-bench Pro, который измеряет способность решать реальные задачи из GitHub, GLM-5.2 набрала 62,1 балла против 58,6 у GPT-5.5 от OpenAI.

Картина не выглядит однозначной. В тесте SWE-Marathon, где проверяют агентное программирование на длинном горизонте, модель получила 13 баллов против 26 у Claude Opus 4.8. Это совпадает с более широким трендом: китайские модели быстро догоняют конкурентов на прикладных и массовых сценариях, но в сложных задачах на рассуждение разрыв сохраняется.

График сравнения моделей LLM с разными скоростями и точностью

Ноутбук с экраном, показывающим сайт Z.ai модель ИИ GLM-5.2

GLM-5.2 построена по схеме Mixture-of-Experts. У модели 744 млрд параметров, но на один вывод задействуется около 40 млрд: маршрутизатор выбирает 8 из 256 экспертных подсетей для каждого токена. Такой подход снижает вычислительную нагрузку по сравнению с плотной архитектурой сопоставимого размера и позволяет удерживать цену обучения в разумных рамках.

Для длинных контекстов Z.ai использует механизм разрежённого внимания DSA, который должен сделать практичным окно до 1 млн токенов. Для корпоративной разработки и анализа больших кодовых баз это важнее красивой цифры в презентации. В реальной инфраструктуре, где нужно прогонять большие репозитории за один проход, экономия на внимании часто важнее пикового результата в одном тесте.

Компромисс заметен по скорости. GLM-5.2 выдаёт примерно 17—19 токенов в секунду, тогда как конкурирующие системы на Nvidia H100 часто работают в диапазоне 25—30 токенов и выше. По оценке экспертов, обучение оказалось примерно на 15% дольше, чем сопоставимый запуск на платформе Nvidia, хотя общая стоимость тренировки составила около $25 млн. Для передовых американских моделей оценки расходов обычно идут на десятки и даже сотни миллионов долларов, особенно если считать не только финальный прогон, но и серию промежуточных запусков.

GLM-5.2 и ограничения на чипы Nvidia

Сравнение производительности моделей ИИ GLM-5.2 и других на тестах

Отдельный вопрос касается использования облачного API Z.ai. Компания зарегистрирована в Пекине и работает в юрисдикции Китая, где законы о национальной разведке, безопасности данных и кибербезопасности дают государству широкие полномочия по доступу к данным. Для западных заказчиков это означает простое разделение: веса можно скачать и держать внутри своего контура, а облачный доступ потребует отдельной оценки рисков. В январе 2025 года Бюро промышленности и безопасности США внесло Z.ai в санкционный список, а в мае 2026 года законодатели Палаты представителей начали расследование рисков китайских ИИ-моделей для критической инфраструктуры.

Для рынка важен не столько сам рекорд в рейтинге, сколько темп сближения. Если к концу 2026 года GLM-5.2 или её преемник подтянется к американским моделям в сложных сценариях рассуждения и агентного программирования, спор о действенности экспортного контроля перейдёт из политической плоскости в бухгалтерскую: США уже ограничили поставки, а Китай всё равно получил конкурентный open source. По оценке McKinsey, мировой рынок генеративного ИИ может добавить экономике до $4,4 трлн в год, и в таком масштабе разница между «замедлить» и «остановить» быстро становится очень дорогой.

Источник: 3dnews

Елизавета Добровольская

Автор itzine.ru с 2021 года. Пишет о смартфонах, гаджетах, железе, искусственном интеллекте и космосе — в общем, обо всём, что есть в мире технологий. От новостей о складных флагманах и процессорах до репортажей о культуре и рынке электромобилей. Следит за индустрией внимательно, но без фанатизма.