Zhipu вывела модель GLM-5.2 на 1-е место в DesignArena

Zhipu AI подняла модель GLM-5.2 на первое место в рейтинге DesignArena для HTML-веб-дизайна без агентных надстроек. Платформа сообщила об этом 19 июня в X, указав, что китайская модель обошла Claude Fable 5, а также версии Opus 4.6 и 4.7. Для сегмента, где долго доминировали американские разработчики, это заметный сдвиг и по качеству, и по цене.
По данным DesignArena, GLM-5.2 прибавила пять позиций к результату GLM-5.1 и получила Elo около 1360 в категории «Код». Платформа оценивает модели через слепое голосование пользователей по готовым веб-страницам, а не по самоотчётам разработчиков. Такой формат ближе к Chatbot Arena и удобен для сравнения визуального результата, хотя он хуже показывает стабильность на длинных и сложных проектах.
В описании тестов DesignArena отмечает, что GLM-5.2 сильна в чистой вёрстке, типографике, визуальной иерархии, подборе изображений с CDN и лёгких анимациях. Модель также уверенно использует популярные библиотеки вроде Chart.js и Three.js. Отдельная деталь касается стека: Tailwind CSS встречался в 91% её дизайнов, Font Awesome — в 51%. У Fable 5 Tailwind фигурировал примерно в 57% сессий, и это могло сказаться на скорости и аккуратности прототипирования.
Второй фактор, который помог GLM-5.2 выделиться, — это тарифы API. Zhipu заявляет цену около $1,40 за 1 млн входных токенов и $4,40 за 1 млн выходных. Для сравнения, у Fable 5 в источнике указаны $10 и $50 соответственно. Разрыв больше чем в семь раз на входе и примерно в одиннадцать раз на выходе. Для студий, которые гоняют десятки итераций макета в день, цена здесь влияет не меньше, чем место в таблице.
Тренд шире одного рейтинга. Китайские разработчики в 2025 году уже показали, что могут давить рынок не только открытыми моделями, как DeepSeek, но и агрессивным ценообразованием в API. На этом фоне успех GLM-5.2 выглядит не разовым всплеском, а продолжением гонки за прикладные сценарии, где важны не абстрактные баллы, а готовый HTML. Следующая проверка для Zhipu будет не в DesignArena, а в реальном использовании: удержится ли модель в продакшене, где важны повторяемость результата, работа с правками и длинный контекст.



