Google интегрирует голосовой ИИ Chirp 3 в Vertex AI: новая волна генеративного ИИ

Google активно развивает генеративный ИИ, и следующим этапом стала работа с голосом. Компания объявила, что добавит Chirp 3, свою передовую голосовую модель, в Vertex AI уже на следующей неделе.
Содержание
Что такое Chirp 3 и зачем он нужен?
На прошлой неделе Google представил 8 новых голосов для 31 языка в рамках Chirp 3. Эта технология предназначена для создания голосовых ассистентов, аудиокниг, автоматизированных агентов поддержки и озвучки видео.
Chirp 3 станет частью экосистемы Google ИИ, наряду с:
- Gemini — флагманская LLM-модель Google,
- Imagen — модель для генерации изображений,
- Veo 2 — продвинутая нейросеть для создания видео.
Ограничения и конкуренция на рынке голосового ИИ
Google вводит ограничения на использование Chirp 3, чтобы предотвратить злоупотребления. «Мы работаем с командой безопасности, чтобы все грамотно организовать», — заявил Томас Курян, CEO Google Cloud.
Сейчас Google активно догоняет конкурентов, таких как Microsoft, Amazon и ElevenLabs, которые уже инвестировали сотни миллионов долларов в развитие голосовых ИИ.
Одним из самых перспективных конкурентов стал стартап Sesame, чьи модели, такие как «Maya» и «Miles», впечатлили пользователей своей реалистичностью. Однако CEO DeepMind Демис Хассабис считает, что это только начало долгого пути.
«Идея, что ИИ решит все проблемы в ближайшие пару лет, пока не кажется реальной. Думаю, до настоящего AGI (общего искусственного интеллекта) еще несколько лет», — отметил он.
Google Vertex AI: борьба за место в облачном ИИ-секторе
Vertex AI был запущен в 2021 году как платформа для работы с машинным обучением в облаке. Однако с приходом OpenAI и ChatGPT интерес к генеративному ИИ резко вырос, и Google вынужден наверстывать упущенное.
Сейчас Google делает ставку на экосистему Vertex AI, предлагая разработчикам инструменты для классификации данных, тренировки моделей и их вывода в продакшен. Вопрос в том, будет ли Google ограничивать платформу только своими моделями или откроет её для сторонних разработчиков.
Что дальше?
Google работает над «Chirp» уже несколько лет — изначально это был кодовый проект для конкуренции с Amazon Alexa. Теперь, с ростом интереса к голосовому ИИ, компания делает ставку на его интеграцию в облачную экосистему.
Chirp 3 может стать важным шагом в развитии голосовых технологий, но сможет ли Google составить конкуренцию стартапам и гигантам вроде Microsoft — покажет время.