Переводчик Google научился имитировать голос пользователя (speech recognition)

Удивительно, как системы, особенно Google, теперь могут переводить то, что мы говорим, практически на лету, но почти все они говорят своими собственными синтезированными голосами. Что бы вы почувствовали, если бы услышали, что вы сами говорите на другом языке, который едва знаете? Это волшебное и почти тревожное будущее, которое Google Translate может предложить благодаря продукту Translatotron.


Переводчик Google научился имитировать голос пользователя (google pixel buds 13)

 «Translatotron » не является новым персонажем «Трансформеров». Это просто название, которое исследователи ИИ из Google дали своей сквозной модели перевода речи в речь. Способность «Translatotron » сохранять голос говорящего-источника даже в переведенной речи на самом деле является лишь следствием истинной природы системы. Большинство систем перевода делят работу на три части. Одна превращает речь в текст, другая берет этот текст и переводит его на другой язык, а третий превращает текст обратно в речь, часто отличающимся голосом от исходного носителя.

Переводчик Google научился имитировать голос пользователя (image1)

Эта каскадная система доказала свою эффективность и практичность, и используется в большинстве систем перевода, включая Google. Исследователи искусственного интеллекта Google, однако, считают, что сквозная система может превзойти ее, удалив среднюю часть. Буквально, она пропускает часть, где речь сначала переводится в текст.


«Translatotron» еще не опередил традиционные каскадные системы в тестах, но доказал, что это выполнимо. Как и любая модель машинного обучения, со временем она может улучшиться. Учитывая преимущество сохранения оригинального голоса говорящего даже в переведенной речи, дальнейшие исследования в этой области могут оказаться полезными для будущих систем перевода Google на базе AI.

Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии