Oracle представила крупнейший суперкомпьютер для искусственного интеллекта

На фоне продолжающегося бума в сфере искусственного интеллекта и примерно через месяц после анонса Microsoft «самого мощного в мире центра обработки данных», Oracle представила свою разработку — OCI Zettascale10, крупнейший в мире центр обработки данных.
Суперкомпьютер не появился случайно — он является ядром суперкластера «Звездные врата», который Oracle вместе с OpenAI строит в Абилине, штат Техас. Zettascale10 способен обеспечить пиковую производительность до 16 зеттафлопс и объединить сотни тысяч графических процессоров NVIDIA, расположенных в нескольких центрах обработки данных, в единую высокоэффективную систему.
OCI использует сетевую архитектуру Oracle Acceleron RoCE в сочетании с ИИ-инфраструктурой Nvidia, что позволяет достичь крайне низкой задержки передачи данных между графическими процессорами. Кластеры Zettascale10 будут размещены в мощных центрах обработки данных с электропотреблением в гигаватты, расположенных в радиусе 2 км друг от друга для минимизации задержек.
По словам исполнительного вице-президента OCI Махеша Тиагараджана, такая архитектура позволит клиентам строить, обучать и выводить в производство крупномасштабные модели ИИ, снижая энергозатраты на единицу вычислительной мощности и обеспечивая высокую надежность систем.
Zettascale10 появился примерно через год после запуска Oracle первого облачного кластера Zettascale, представленного на выставке Cloud World 2024, который мог насчитывать до 131 072 графических процессоров Nvidia. Сейчас количество GPU увеличилось до 800 000, что делает новый суперкомпьютер одним из крупнейших в мире.
Oracle планирует начать выпуск и коммерческое использование Zettascale10 во второй половине 2026 года. Важное значение в успехе проекта имеет именно сетевая архитектура Acceleron RoCE, обеспечивающая максимальную эффективность связи внутри кластеров.
Oracle уже инвестировала в инфраструктуру OpenAI, предоставив 4,5 гигаватта мощностей Stargate стоимостью более 300 миллиардов долларов. Кроме того, компания строит новые дата-центры в Техасе, Нью-Мексико и на Среднем Западе США.
По словам нового генерального директора Oracle Клея Магоуирка, быстрое расширение инфраструктуры OCI позволит удовлетворить растущий спрос на эффективное и экономичное обучение и развертывание моделей искусственного интеллекта.