
Сбер добавил якутский язык в GigaChat. Для Якутии это практическая вещь, а не декоративная галочка в отчете: родной язык добрался до массового ИИ-сервиса, через который можно спрашивать, писать, объяснять и решать бытовые задачи.
О запуске сообщил глава республики Айсен Николаев. Якутский, или саха тыла, относится к тюркским языкам, а число его носителей превышает 450 тысяч человек. Для больших языковых моделей это сложная территория: мало качественно оцифрованных текстов, много морфологии, мало размеченных данных. Без местных университетов, библиотек и редакций такие проекты обычно заканчиваются красивой презентацией и ничем больше.
По заявлению региона, на якутском в GigaChat уже можно:
Корпус для обучения собирали не только силами Сбера. В работу вошли Лаборатория искусственного интеллекта Якутии, Северо-Восточный федеральный университет, Национальная библиотека и несколько местных медиа. Это важная деталь: GigaChat живет с 2023 года, но поддержка языков такого масштаба появляется только там, где есть живая локальная инфраструктура, а не один пресс-релиз про «сохранение наследия».
Для Сбера это еще и витрина зрелости модели. Крупные зарубежные ассистенты охотнее расширяются на языки с огромной коммерческой аудиторией вроде испанского, арабского или хинди. С языками коренных народов экономика слабее, зато ценность для образования, госуслуг и местных медиа гораздо выше. В этом смысле Якутия получила то, до чего глобальные платформы обычно просто не доходят руками.
До конца 2026 года российские ИИ-модели могут добрать еще 2—3 региональных языка, и первыми кандидатами выглядят татарский и башкирский.