Яндекс уменьшил голосовую нейросеть до 200 КБ для наушников

Яндекс разработал сверхкомпактную нейросеть для голосового управления на носимых устройствах. Модель занимает около 200 КБ и рассчитана на локальную работу в наушниках и часах, где жёстко ограничены батареи и вычислительные ресурсы. Первым устройством с этой технологией, как ожидается, станут наушники «Яндекс Дропс» с «Алисой AI».

О разработке сообщил руководитель направления голосовой активации Дмитрий Солодуха. В Яндексе уточнили, что объём модели меньше одной фотографии со смартфона. Для носимой электроники это важнее, чем звучит в пресс-релизе: такие устройства должны непрерывно слушать окружающий звук, быстро реагировать на команду и не уходить в зарядку к обеду.

Компания использует двухэтапную схему. Сначала лёгкая модель проверяет, есть ли в аудиопотоке речь. Более тяжёлая нейросеть для распознавания команды включается только после этого. По данным Яндекса, число параметров основной модели удалось сократить примерно в 10 раз за счёт новой архитектуры. Дополнительно расчёт сделан на чипы с NPU, то есть нейропроцессором, который выполняет такие задачи экономичнее обычного CPU.

Подход укладывается в общий тренд рынка. Apple, Google и Samsung за последние два года перенесли всё больше ИИ-функций на устройство, чтобы снизить задержку и зависимость от облака. В сегменте носимой электроники это особенно заметно: по оценке IDC, мировые поставки wearables в 2025 году превысили 530 млн штук, и в этой категории борьба идёт не только за функции, но и за милливатты и миллисекунды.

Для Яндекса это не первый заход в железо с «Алисой», но один из самых прагматичных по конструкции продукта. У компании уже были умные колонки, ТВ-устройства и автомобильные решения, а теперь акцент смещается в персональные гаджеты. Если «Дропс» выйдут в 2026 году в заявленной конфигурации с «Моей памятью», Яндексу придётся конкурировать не только с классическими TWS-наушниками, но и с устройствами, где голосовой интерфейс постепенно становится основной точкой входа в ИИ-сервисы.

Максим Третьяков
Технический обозреватель, пишет в основном про рынок мобильных телефонов и автомобильные технологии. Максим подготовил 740 материалов, в которых анализирует запуск флагманских линеек смартфонов (включая бренды Xiaomi и Apple), развитие нейросетевых функций в потребительских гаджетах и актуальное состояние отечественного автопрома. Его экспертиза охватывает как аппаратные новинки — от концептов видеокарт до умных колец, — так и правовые аспекты технологического рынка.

Leave a reply