Журналисты проверили качество распознавания текста в Pixel 4 (google pixel 4 1068 1571345153)

Встроенный транскрибатор — одна из главных фишек нового смартфона Google Pixel 4. Он распознает речь и с помощью искусственного интеллекта преобразовывает её в текст. Журналисты The Wall Street решили протестировать, как смартфон с правится с речью носителей разных языков, акцентом и самой быстроговорящей женщиной в мире.


Функция транскрибирования находится в стандартном приложении «Диктофон». По словам представителей Google, она намного лучше справляется с задачей, чем другие подобные программы. Такого хорошего результата разработчики добились благодаря использованию искусственного интеллекта.

Важная особенность — функция транскрибирования работает даже при выключенном интернете. Все необходимые библиотеки хранятся на самом устройства.


Алгоритм без проблем разобрал речь автора эксперимента, кое-где даже расставил знаки пунктуации. Соперником компьютера была стенографистка с многолетним стажем. Она может набирать до 260 слов в минуту.

Журналисты проверили качество распознавания текста в Pixel 4 (snimok jekrana ot 2019 10 24 15 57 59)

Потом алгоритм распознавал запись голоса самой быстроговорящей женщины в мире (её статус зафиксирован в Книге рекордов Гиннеса). Всего дня расшифровки использовали две записи: отрывок из сказки «Три поросёнка» и отрывок из «Гамлета».


С первым отрывком лучше справилась стенографистка, смартфон почти ни слова не разобрал. Но с расшифровкой «Гамлета» алгоритм справился хорошо.

Так же, для эксперимента журналисты пригласили людей из Новой Зеландии, Ирландии, Ямайки и Германии. Смартфон распознал речь каждого из них, но допустил ошибки.


Тем не менее, авторы эксперимента сказали, что возможности алгоритма транскрибации впечатляют.

Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии