Журналисты проверили качество распознавания текста в Pixel 4
Встроенный транскрибатор — одна из главных фишек нового смартфона Google Pixel 4. Он распознает речь и с помощью искусственного интеллекта преобразовывает её в текст. Журналисты The Wall Street решили протестировать, как смартфон с правится с речью носителей разных языков, акцентом и самой быстроговорящей женщиной в мире.
Функция транскрибирования находится в стандартном приложении «Диктофон». По словам представителей Google, она намного лучше справляется с задачей, чем другие подобные программы. Такого хорошего результата разработчики добились благодаря использованию искусственного интеллекта.
Важная особенность — функция транскрибирования работает даже при выключенном интернете. Все необходимые библиотеки хранятся на самом устройства.
Алгоритм без проблем разобрал речь автора эксперимента, кое-где даже расставил знаки пунктуации. Соперником компьютера была стенографистка с многолетним стажем. Она может набирать до 260 слов в минуту.
Потом алгоритм распознавал запись голоса самой быстроговорящей женщины в мире (её статус зафиксирован в Книге рекордов Гиннеса). Всего дня расшифровки использовали две записи: отрывок из сказки «Три поросёнка» и отрывок из «Гамлета».
С первым отрывком лучше справилась стенографистка, смартфон почти ни слова не разобрал. Но с расшифровкой «Гамлета» алгоритм справился хорошо.
Так же, для эксперимента журналисты пригласили людей из Новой Зеландии, Ирландии, Ямайки и Германии. Смартфон распознал речь каждого из них, но допустил ошибки.
Тем не менее, авторы эксперимента сказали, что возможности алгоритма транскрибации впечатляют.