Z.ai открыла ИИ-модель GLM-5.2 для генерации кода

Большая 3D буква A и I с заговорами проводов

Китайский разработчик Z.ai, ранее известный как Zhipu, представил языковую модель GLM-5.2 с открытыми весами и 753 млрд параметров. Компания продвигает её как инструмент для программирования и агентных задач с длинной цепочкой действий, где модель должна удерживать контекст и план на много шагов вперёд. На этом рынке Z.ai делает ставку не на чат-интерфейс, а на подключение к средам разработки и локальный запуск.

GLM-5.2 можно использовать через API Z.ai и на Hugging Face, а также подключать более чем к 20 сторонним инструментам разработки. Модель получила контекстное окно на 1 млн токенов. Основные веса распространяются по лицензии MIT, поэтому компании могут скачать модель, дообучить её под собственные задачи и запускать локально, оплачивая только инфраструктуру.

Это заметный шаг для сегмента открытых моделей. За последний год Meta* с семейством Llama, Mistral с Codestral и Alibaba с Qwen нарастили давление на закрытых поставщиков, а корпоративный спрос сместился от универсальных чат-ботов к специализированным моделям для кода, поиска по документации и внутренних агентов. По оценке Menlo Ventures, корпоративные расходы на генеративный ИИ в 2025 году росли прежде всего в задачах разработки ПО и автоматизации рабочих процессов, где важны цена инференса и возможность развернуть модель в своём контуре.

Характеристики GLM-5.2

Z.ai заявляет, что в GLM-5.2 применена архитектурная оптимизация IndexShare. Один индексатор повторно используется для четырёх слоёв разрежённого внимания, что при контексте в 1 млн токенов снижает вычислительную нагрузку в 2,9 раза. Для корпоративных пользователей это важнее красивых графиков: длинный контекст без контроля себестоимости быстро превращается в дорогую демонстрацию возможностей.

Результаты сравнения моделей LLM: Z.ai GLM-5.2 и конкуренты

Компания также использует обновлённую схему многотокенного предсказания. При спекулятивном декодировании она позволяет пропускать на 20% больше токенов во время инференса, то есть ускорять выдачу и снижать расход ресурсов. Отдельно Z.ai добавила переключение режимов рассуждений: «максимальный» для сложных логических задач и «высокий» как компромисс между качеством и скоростью. В первом режиме модель в среднем генерирует около 85 тыс. токенов на задачу, во втором примерно вдвое меньше.

Сравнение производительности моделей ИИ Z.ai GLM-5.2 и другие на различных тестах

753 млрд параметров
Контекстное окно 1 млн токенов
Лицензия MIT для основных весов
Поддержка более 20 IDE и инструментов
Оптимизация IndexShare для длинного контекста
Режимы рассуждений с разным расходом токенов

По данным самой Z.ai, новая модель в тестах на программирование и агентные сценарии опередила большинство открытых конкурентов и выступила на уровне или выше ряда закрытых систем, включая OpenAI GPT-5.5 и Anthropic Claude Opus 4.8. Такие заявления требуют осторожности: в ИИ-индустрии результат часто зависит от выбранного набора тестов, режима запуска и длины цепочки рассуждений. Но сам акцент показателен. Если год назад открытые модели в коде чаще сравнивали друг с другом, то теперь китайские разработчики напрямую меряются с OpenAI и Anthropic.

Цена и доступность

Z.ai запустила отдельную подписку GLM Coding Plan, ориентированную именно на интеграцию с инструментами разработки. В списке совместимых приложений компания называет Claude Code, OpenClaw, Cline, Kilo Code, Crush и Factory. Это ещё один сдвиг в позиционировании: модель продают не как собеседника, а как рабочий слой внутри IDE и CI-процессов.

Lite: $12,60 в месяц или $151,20 в год
Pro: $50,40 в месяц, в 5 раз больше ресурсов
Max: $112 в месяц, в 20 раз больше ресурсов
API: $1,40 за 1 млн входных токенов
API: $4,40 за 1 млн выходных токенов

Цены выглядят агрессивно на фоне закрытых моделей для кода, особенно если заказчику нужен локальный контур или кастомизация под внутренние репозитории. Для сравнения, у открытых конкурентов вроде Codestral и Qwen-Coder ставка тоже строится на более дешёвом инференсе и гибкости развёртывания, а не только на качестве ответов. На китайском рынке к этому добавляется фактор технологического суверенитета: местные компании всё активнее выбирают модели, которые можно контролировать внутри собственной инфраструктуры.

Для Z.ai релиз GLM-5.2 может стать попыткой закрепиться в узком, но быстрорастущем сегменте coding-моделей. По данным GitHub, инструменты ИИ-помощи уже используют десятки миллионов разработчиков, а корпоративные закупки всё чаще уходят в специализированные подписки для команд. Ближайший тест для GLM-5.2 будет практическим: удержит ли она заявленное качество на длинных рабочих сценариях, где сравнение по одному бенчмарку заканчивается и начинается стоимость ошибки.

* Принадлежит компании Meta, она признана экстремистской организацией в РФ и её деятельность запрещена.

Источник: 3dnews

Елизавета Добровольская

Автор itzine.ru с 2021 года. Пишет о смартфонах, гаджетах, железе, искусственном интеллекте и космосе — в общем, обо всём, что есть в мире технологий. От новостей о складных флагманах и процессорах до репортажей о культуре и рынке электромобилей. Следит за индустрией внимательно, но без фанатизма.