DeepSeek выпускает мощную файловую систему Fire-Flyer с открытым исходным кодом (ara)

На этой неделе DeepSeek AI сделала свою параллельную файловую систему Fire-Flyer Fire System (3FS) полностью открытой в рамках своего мероприятия Open Source Week. Эта китайская компания утверждает, что 3FS может достигать совокупной пропускной способности чтения 7,3 ТБ/с в своих кластерах данных, где она использует 3FS для организации серверов с 2019 года.

3FS — это параллельная файловая система на базе Linux, разработанная для операций AI-HPC, где узлы GPU постоянно обращаются к множеству серверов хранения данных для обучения больших языковых моделей (LLM). Основное отличие 3FS от других файловых систем заключается в приоритете случайных скоростей чтения и игнорировании кэширования чтения.

При обучении моделей ИИ вычислительные блоки должны постоянно получать доступ к случайным данным, и чтение этих данных происходит один раз. Поэтому кэш чтения практически бесполезен, и 3FS избавлен от него. Использование кэша может даже навредить, так как многократное чтение одних и тех же данных может связать их с языковой моделью.

Команда, работающая с кластером глубокого обучения DeepSeek, Fire-Flyer 2, ранее описала использование 3FS в своей системе. В Fire-Flyer 2 DeepSeek использовал 180 узлов хранения, каждый из которых имел 16 SSD по 16 ТБ и два NUC с пропускной способностью 200 Гбит/с. Эти узлы обслуживали 10 000 графических процессоров Nvidia A100, построенных на более дешевых серверах, чем фирменные продукты Nvidia DGX-A100.

DeepSeek утверждает, что производительность 3FS достигла 6,6 ТБ/с, а фоновое выполнение обучающих задач добавило еще 1,4 ТБ/с. Для сравнения, файловая система Ceph достигла скорости чтения 1,1 ТБ/с на сервере с 68 узлами в начале 2024 года.

3FS была названа важной частью программного стека DeepSeek для обучения, так как она достигла 80% производительности серверного решения Nvidia DGX-A100 при 50% стоимости и 60% потребляемой мощности.

Те, кто хочет попробовать Fire-Flyer File System и ее стиль случайного чтения для AI-HPC, могут найти полную загрузку на странице DeepSeek на GitHub. Эта новая система с открытым исходным кодом может стать популярной среди энтузиастов и корпоративных пользователей AI-HPC, хотя ей, возможно, придется преодолеть определенные предвзятости, связанные с китайскими технологиями.

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии