Швейцария запускает собственную модель ИИ с открытым исходным кодом

В гонке за лидерство в области искусственного интеллекта появился новый игрок — целая страна. Швейцария представила Apertus — открытую национальную LLM-модель, которая должна стать альтернативой решениям таких компаний, как OpenAI. Название Apertus в переводе с латинского означает «открытый». Разработкой занимались Федеральный технологический институт Лозанны (EPFL), ETH Zurich и Швейцарский национальный центр суперкомпьютеров (CSCS) — все они являются государственными организациями.
«Сегодня Apertus — ведущая публичная AI-модель: созданная государственными институтами в интересах общества. Это лучшее доказательство того, что искусственный интеллект может быть формой общественной инфраструктуры, подобной дорогам, воде или электричеству», — отметил Джошуа Тан, сторонник концепции AI как публичного ресурса.

Apertus создана полностью открытой: пользователи могут изучать все этапы её обучения. Помимо самой модели, опубликованы исходный код, документация и датасеты, использованные при подготовке. Весь процесс соответствует законам Швейцарии о защите данных и авторском праве, что делает её особенно привлекательной для европейских компаний. Ранее Ассоциация швейцарских банкиров заявляла, что национальная LLM имеет «большой долгосрочный потенциал», так как сможет полностью соответствовать строгим местным требованиям к защите данных и банковской тайне. Пока банки используют другие модели, но не исключено, что в будущем они перейдут на Apertus.
К новой модели открыт доступ для всех — исследователей, энтузиастов и компаний, которые могут адаптировать её под свои нужды. Apertus можно использовать для создания чат-ботов, переводчиков, образовательных и обучающих сервисов. Модель обучена на 15 триллионах токенов более чем на 1000 языках, при этом 40% данных составляют тексты не на английском, включая швейцарский немецкий и романшский. Важно, что в обучении применялись только открытые источники, а её краулеры учитывали запреты на сбор данных, выставленные на сайтах. Это выгодно отличает Apertus от некоторых AI-компаний, которых обвиняли в игнорировании протоколов и незаконном использовании контента.
Модель доступна в двух версиях — с 8 и 70 миллиардами параметров. Получить доступ можно через Swisscom или платформу Hugging Face.