maia200 hero image

Microsoft объявила о запуске своего нового процессора Maia 200, который компания называет универсальным кремниевым решением для масштабирования инференса искусственного интеллекта.

Maia 200 стал преемником чипа Maia 100, представленного в 2023 году. По заявлению Microsoft, новый процессор технически оптимизирован для более быстрого и энергоэффективного запуска мощных ИИ-моделей. Чип содержит более 100 миллиардов транзисторов и обеспечивает свыше 10 петафлопс производительности при 4-битной точности, а также около 5 петафлопс при 8-битных вычислениях, что заметно превосходит показатели предыдущего поколения.

Инференс — это этап выполнения уже обученной модели, в отличие от вычислений, необходимых для ее обучения. По мере развития ИИ-компаний затраты на инференс становятся все более значимой частью операционных расходов, что усиливает интерес к оптимизации этого процесса.

Microsoft рассчитывает, что Maia 200 поможет снизить энергопотребление и повысить стабильность работы ИИ-сервисов. В компании отмечают, что на практике один узел Maia 200 способен без труда запускать самые крупные современные модели, сохраняя значительный запас мощности для еще более сложных моделей в будущем.

Новый чип также отражает общую тенденцию среди технологических гигантов к разработке собственных процессоров, чтобы снизить зависимость от Nvidia, чьи передовые графические ускорители играют ключевую роль в индустрии ИИ. У Google, например, есть собственные тензорные процессоры TPU, доступные через облачную инфраструктуру, а Amazon развивает линейку ускорителей Trainium, последняя версия которых — Trainium3 — была представлена в декабре. Во всех этих случаях собственные чипы позволяют частично заменить вычисления на GPU Nvidia и сократить общие затраты на оборудование.


С выходом Maia Microsoft намерена конкурировать с этими альтернативами. В своем пресс-релизе компания заявила, что Maia 200 обеспечивает втрое более высокую производительность FP4 по сравнению с чипами Amazon Trainium третьего поколения, а также превосходит TPU седьмого поколения от Google по показателям FP8.

По данным Microsoft, чип Maia уже используется для работы ИИ-моделей команды Superintelligence, а также задействован в поддержке чат-бота Copilot. Кроме того, компания сообщила, что открыла доступ к набору инструментов разработки Maia 200 для разработчиков, ученых и передовых ИИ-лабораторий, которые могут использовать его в своих вычислительных задачах.

Источник: Techcrunch

Leave a reply

Ваш адрес email не будет опубликован. Обязательные поля помечены *