AMD и Intel утвердили ИИ-инструкции ACE для x86-чипов

AMD и Intel согласовали новый набор инструкций для x86-процессоров, рассчитанный на матричные вычисления и запуск ИИ-моделей на CPU. Спецификация получила название AI Compute Extensions, или ACE. Это попытка встроить в классические процессорные ядра функции, которые до сих пор чаще выносили в NPU, GPU или отдельные матричные блоки.
Работу над спецификацией AMD и Intel ведут с осени 2024 года в рамках Консультативной группы экосистемы x86. Цель прямая: удержать позиции x86 на фоне Arm и RISC-V, которые быстрее добавляют специализированные блоки для ИИ-нагрузок. В опубликованной версии ACE 1.15 описаны именно инструкции и форматы данных, а не конкретная аппаратная реализация.
ACE ориентирован в первую очередь на умножение матриц с использованием форматов данных, применяемых при инференсе квантованных моделей. Спецификация вводит 11 форматов данных, часть из них имеет несколько представлений. Кроме самих вычислений, документ описывает преобразования между форматами, то есть разработчикам дают не только математический блок, а более широкий набор операций для ИИ-конвейера.
Новый набор будет тесно связан с AVX. В спецификации прямо упоминаются AVX10 и обязательная поддержка части инструкций AVX10.2 для процессоров с ACE-v1. Там же фигурируют Advanced Matrix Extensions, или AMX, которые Intel до сих пор использовала только в серверных Xeon. По сути, речь идет о переносе матричных возможностей из серверного сегмента ближе к массовым x86-чипам, хотя сроки остаются далекими.
По текущим оценкам, первые процессоры с ACE-v1 едва ли появятся в продаже раньше 2028 года. Ни AMD в линейке Zen 6, ни Intel в Nova Lake о поддержке ACE не говорили. Самый близкий намек прозвучал у AMD: компания упоминала некий Matrix Engine для Zen 7. Если этот блок действительно связан с ACE, то именно Zen 7 может стать первой клиентской реализацией нового стандарта.
Инструкции ACE для x86-процессоров
Для x86 это догоняющий шаг. У Arm уже есть утвержденные Scalable Matrix Extensions второго поколения, построенные поверх SVE2. Эти блоки производители SoC встраивают по-разному, в зависимости от своих задач по энергопотреблению и площади кристалла. Apple использует SME2 начиная с чипов M4, а Qualcomm внедряет поддержку в Snapdragon X2. На фоне этого x86-платформы долго опирались на более разрозненный набор ускорителей.
До сих пор производители x86-чипов шли двумя маршрутами. Первый это NPU, которые появились в массовых процессорах в 2023 году и хорошо подходят для фиксированных ИИ-задач при низком энергопотреблении. Второй это серверные матричные блоки. Intel, например, внедрила AMX в Xeon поколения Sapphire Rapids, где они рассчитаны на обучение и инференс в дата-центрах, а не на тонкие ноутбуки.
У обоих подходов есть ограничения. NPU занимают заметную площадь на кристалле и плохо масштабируются под нестандартные форматы и модели. GPU дают больше гибкости, но дороже по энергии и часто избыточны для локального инференса на CPU-ориентированных задачах. ACE выглядит как компромисс: добавить часть нужных ИИ-операций прямо в центральный процессор, не превращая его в отдельный ускоритель под один сценарий.
На решение влияет и политика Microsoft. В 2024 году корпорация потребовала NPU с производительностью не ниже 40 TOPS в формате INT8 для маркировки Copilot+. Позже требования смягчили и допустили использование GPU. Если ACE даст сравнимую производительность в некоторых режимах инференса, Microsoft может еще раз пересмотреть критерии сертификации. Для производителей ноутбуков это важно: отдельный NPU перестанет быть единственным входным билетом в категорию ПК с локальным ИИ.
С коммерческой точки зрения ставки высоки. Arm уже усилил позиции в ПК через Apple Silicon и Windows-ноутбуки на Snapdragon, а в серверном сегменте его доля также растет за счет облачных провайдеров. x86 все еще доминирует в корпоративных ПК и серверах, поэтому согласованный стандарт между AMD и Intel снижает риск фрагментации для разработчиков компиляторов и библиотек. Без общей спецификации рынок получил бы два несовместимых способа ускорять одни и те же модели на CPU.
Если график не сдвинется, практический эффект от ACE рынок увидит не раньше 2028 года, когда начнется обновление клиентских и серверных платформ следующего цикла. К этому моменту Arm успеет выпустить еще как минимум одно поколение матричных расширений в массовых чипах. Для AMD и Intel это означает простую задачу без лишней романтики: не просто догнать конкурента по набору инструкций, а убедить разработчиков, что CPU снова годится для локального ИИ не только как диспетчер нагрузки.



