Google Gemini Live

Общение с искусственным интеллектом когда-то казалось чем-то из научной фантастики, но сегодня это повседневная реальность благодаря таким инструментам, как Gemini Live. Эти AI-ассистенты становятся все удобнее и естественнее в общении, а Google продолжает совершенствовать их возможности.


Обновление Gemini Live: что нового?

Google разослала пользователям письмо с анонсом значительного обновления Gemini Live. Новый AI-модель делает ассистента еще умнее, улучшая его способность понимать различные языки, акценты и диалекты. Кроме того, значительно усовершенствованы функции перевода.

Еще одно важное нововведение — поддержка демонстрации экрана и потоковой передачи видео в реальном времени. Чтобы эти функции работали корректно, Google начнет сохранять аудио, видео и данные экранного вещания в журнале активности Gemini Apps (если он включен). Сейчас сохраняются только текстовые расшифровки разговоров.

Подпишись на канал ForGeeks! Гаджеты, технологии и космос


Google Gemini Live

Gemini 2.0: новая эра AI

С выпуском Gemini 2.0 в конце прошлого года Google представила Multimodal Live API, позволяющий разработчикам обрабатывать текстовые, аудио- и видео-входные данные и выдавать текстовые или голосовые ответы. По всей вероятности, именно этот API является основой работы обновленного Gemini Live.

Google называет Gemini 2 началом «эры агентов» (Agent Era). Этот AI на уровне OpenAI o1, но с дополнительными возможностями: он может нативно генерировать изображения, речь, текст и другие элементы. Первая модель в этой линейке — Gemini 2.0 Flash, пока что находящаяся в статусе «экспериментальной». По данным Google, она в два раза быстрее своего предшественника, Gemini Pro 1.5, и превосходит его по ключевым показателям производительности.

Когда был выпущен Gemini 1.0, AI-ассистенты в основном использовались для создания контента и общения — это был «чатбот-этап». Затем, с приходом OpenAI o1, началась «эра рассуждений», когда AI стал лучше анализировать информацию и понимать логику. Теперь же мы вступаем в «агентскую эру», где AI не просто отвечает на запросы, а выполняет сложные задачи самостоятельно.


Google явно намерена сделать Gemini Live более интерактивным и полезным инструментом в повседневной жизни пользователей.

Подпишись на ITZine в Дзен Новостях
Читай ITZine в Telegram
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии