Fluent научился угадывать речь по сигналам мозга

Австралийский стартап Fluent, созданный при Университете Мельбурна, делает систему для людей, которые потеряли речь из-за болезней двигательных нейронов, рассеянного склероза и других тяжёлых нарушений. Устройство должно ловить сигналы, которые мозг всё ещё выдаёт в момент попытки заговорить, и переводить их в текст или синтезированную речь. В первых тестах система выбирала нужную фразу из 128 вариантов с точностью до 96%.
Сам Fluent описывает свою разработку как компромисс между безопасностью и качеством сигнала. В известных интерфейсах мозг-компьютер электроды вживляют прямо в мозг, а здесь система должна стоять под кожей, но над черепом. Это подскальповый интерфейс. Он не требует операции на ткани мозга, зато даёт более чистый сигнал, чем полностью внешние решения.
Основная ставка — на моторную кору. Она управляет движениями мышц, в том числе языка, губ и челюсти. Когда человек пытается произнести слово, нейроны рисуют свой характерный электрический узор. В компании сравнивают эти паттерны с QR-кодами: для каждого движения артикуляционного аппарата мозг выдаёт свой набор сигналов, а алгоритм уже собирает из них фразу.
Чтобы обучить модель, команда собрала большую базу речевых нейросигналов. В экспериментах использовали каппы со 144 электродами над моторной корой. Добровольцы говорили вслух, имитировали речь без звука и проговаривали фразы про себя. На этой базе Fluent вместе с японскими исследователями обучил систему, которая в лабораторном сценарии смогла угадать нужную фразу из 128 вариантов с точностью до 96%. Результат высокий, но речь пока идёт о контролируемом наборе реплик, не о свободном разговоре.
Подскальповый интерфейс Fluent
Рынок нейроинтерфейсов за последние два года заметно оживился. Neuralink Илона Маска уже показывает управление курсором и набор текста с помощью импланта, а Synchron делает ставку на более мягкий путь через сосуды. Обе компании работают в первую очередь для людей с тяжёлым параличом, но восстановление речи для отрасли стало отдельной гонкой.
В 2023 и 2024 годах исследовательские группы в США публиковали результаты, где имплантируемые системы переводили мозговую активность в текст со скоростью в десятки слов в минуту. Такие решения обычно дают более точный сигнал: электроды находятся ближе к источнику активности. Но за это приходится платить операцией, долгим восстановлением и более жёсткой проверкой со стороны регуляторов.
Fluent пытается зайти с другой стороны. Стартап прямо признаёт, что по «сырому» качеству сигнала подскальповый интерфейс уступает глубоким имплантам. Компенсировать это он собирается за счёт ИИ, в том числе языковых моделей, которые достраивают фразы по контексту. Похоже на обычное распознавание речи, где система угадывает слово не только по звуку, но и по соседним словам. Только здесь вместо микрофона — слабый и шумный нейросигнал.
У такого подхода есть и коммерческий смысл. По оценкам ряда отраслевых аналитиков, мировой рынок BCI уже измеряется миллиардами долларов и растёт двузначными темпами, но массовым он так и не стал из-за цены и сложности внедрения. Если подскальповый формат подтвердит клиническую ценность, он может оказаться ближе к реабилитационной медтехнике, чем к экспериментальной нейрохирургии. Для пациентов это важнее красивых презентаций: нужен инструмент, который можно получить без слишком большого медицинского риска.
До готового продукта Fluent ещё далеко. Любая такая система проходит длинный путь от лабораторных тестов до клинических исследований и сертификации медицинского устройства. Но Австралия может дать проекту фору: страна давно пытается привлекать медтех-стартапы через исследовательские гранты и налоговые льготы, а местная регуляторная среда считается более удобной для ранних испытаний, чем в ряде других юрисдикций. Если компания покажет сопоставимые результаты не на наборе из 128 фраз, а в более свободной речи, это уже станет демонстрацией технологии и почти рабочим инструментом общения.



