Google разрабатывает ИИ-систему для автоматизации действий в браузере
Google, как сообщается, работает над новой системой искусственного интеллекта, способной выполнять действия в браузере от лица пользователя. Проект, известный под кодовым названием Project Jarvis, может быть представлен уже в декабре, сообщает The Information. Jarvis предназначен для выполнения различных задач, таких как «сбор информации, покупка товаров или бронирование билетов», по словам трёх источников, знакомых с проектом.
Содержание
Возможности Project Jarvis и использование Google Gemini
Project Jarvis использует мощь будущей версии Google Gemini и настроен специально для работы с браузером Chrome. Система направлена на автоматизацию рутинных задач в интернете, таких как взаимодействие с интерфейсами, обработка скриншотов, нажатие кнопок и ввод текста. В текущем состоянии система выполняет действия с задержкой в несколько секунд между шагами.
Конкуренция среди ИИ-компаний
Ведущие компании в области ИИ также разрабатывают похожие системы. Microsoft работает над Copilot Vision, который позволит общаться с пользователем о содержимом веб-страниц. Apple Intelligence планирует внедрить функции, позволяющие системе выполнять действия на экране пользователя в разных приложениях. Также Anthropic уже тестирует «ошибочную и громоздкую» бета-версию Claude, способную работать на компьютере пользователя, а OpenAI разрабатывает аналогичный инструмент.
Тестирование и возможные изменения сроков
Планируемая презентация Jarvis в декабре может быть перенесена, сообщает The Information. В ближайшее время Google планирует запустить проект для ограниченного круга тестеров, чтобы выявить ошибки и доработать систему перед массовым запуском.