Встроенный транскрибатор – одна из главных фишек нового смартфона Google Pixel 4. Он распознает речь и с помощью искусственного интеллекта преобразовывает её в текст. Журналисты The Wall Street решили протестировать, как смартфон с правится с речью носителей разных языков, акцентом и самой быстроговорящей женщиной в мире.

Функция транскрибирования находится в стандартном приложении “Диктофон”. По словам представителей Google, она намного лучше справляется с задачей, чем другие подобные программы. Такого хорошего результата разработчики добились благодаря использованию искусственного интеллекта.

Важная особенность – функция транскрибирования работает даже при выключенном интернете. Все необходимые библиотеки хранятся на самом устройства.

Алгоритм без проблем разобрал речь автора эксперимента, кое-где даже расставил знаки пунктуации. Соперником компьютера была стенографистка с многолетним стажем. Она может набирать до 260 слов в минуту.

Журналисты проверили качество распознавания текста в Pixel 4

Потом алгоритм распознавал запись голоса самой быстроговорящей женщины в мире (её статус зафиксирован в Книге рекордов Гиннеса). Всего дня расшифровки использовали две записи: отрывок из сказки “Три поросёнка” и отрывок из “Гамлета”.

С первым отрывком лучше справилась стенографистка, смартфон почти ни слова не разобрал. Но с расшифровкой “Гамлета” алгоритм справился хорошо.

Так же, для эксперимента журналисты пригласили людей из Новой Зеландии, Ирландии, Ямайки и Германии. Смартфон распознал речь каждого из них, но допустил ошибки.

Тем не менее, авторы эксперимента сказали, что возможности алгоритма транскрибации впечатляют.

Подписывайтесь на IT Zine в Telegram