Встроенный транскрибатор — одна из главных фишек нового смартфона Google Pixel 4. Он распознает речь и с помощью искусственного интеллекта преобразовывает её в текст. Журналисты The Wall Street решили протестировать, как смартфон с правится с речью носителей разных языков, акцентом и самой быстроговорящей женщиной в мире.

Функция транскрибирования находится в стандартном приложении «Диктофон». По словам представителей Google, она намного лучше справляется с задачей, чем другие подобные программы. Такого хорошего результата разработчики добились благодаря использованию искусственного интеллекта.

Важная особенность — функция транскрибирования работает даже при выключенном интернете. Все необходимые библиотеки хранятся на самом устройства.

Алгоритм без проблем разобрал речь автора эксперимента, кое-где даже расставил знаки пунктуации. Соперником компьютера была стенографистка с многолетним стажем. Она может набирать до 260 слов в минуту.

Потом алгоритм распознавал запись голоса самой быстроговорящей женщины в мире (её статус зафиксирован в Книге рекордов Гиннеса). Всего дня расшифровки использовали две записи: отрывок из сказки «Три поросёнка» и отрывок из «Гамлета».

С первым отрывком лучше справилась стенографистка, смартфон почти ни слова не разобрал. Но с расшифровкой «Гамлета» алгоритм справился хорошо.

Так же, для эксперимента журналисты пригласили людей из Новой Зеландии, Ирландии, Ямайки и Германии. Смартфон распознал речь каждого из них, но допустил ошибки.

Тем не менее, авторы эксперимента сказали, что возможности алгоритма транскрибации впечатляют.

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии