Google представил второе поколение AI-моделей в мобильном приложении Gemini

Компания Google анонсировала обновление своих AI-моделей для платформы Gemini, представив экспериментальные версии Gemini 2.0 Pro и Flash-Lite. Эти разработки, по заявлению компании, стали «самыми продвинутыми» в её арсенале. Gemini 2.0 Pro выделяется улучшенными возможностями анализа, обработки сложных запросов и генерации кода, а также поддерживает контекстное окно до 2 миллионов токенов, что позволяет модели работать с огромными объёмами данных. Модель уже доступна подписчикам Gemini Advanced.

Содержание

1. Доступность и экономичность

2. Инновации для смартфонов

3. Конкуренция и перспективы

Доступность и экономичность

В дополнение к этому Google анонсировал публичный тестовый доступ к Gemini 2.0 Flash-Lite — упрощённой версии, созданной для экономии ресурсов и молниеносной обработки данных. Модель встроена в экосистему Google AI Studio и Vertex AI, что упрощает её использование разработчиками. Оба решения — как Pro, так и Flash-Lite — теперь поддерживаются мобильным приложением Gemini, предоставляя пользователям свободу выбора между экспериментальными режимами: мощной аналитикой для сложных задач или быстрыми ответами для повседневных запросов.

Инновации для смартфонов

Главной новинкой стала модель Gemini 2.0 Flash Thinking Experimental, которая не только анализирует данные из YouTube, Google Поиска и Карт, но и комбинирует их, предлагая ответы с учётом самой свежей информации, например, запрос о туристическом маршруте может быть дополнен актуальными видеообзорами достопримечательностей. Ещё одна ключевая особенность — режим «рассуждений», который в реальном времени отображает, как модель разбивает запрос на логические этапы, формируя итоговый ответ. Это делает процесс прозрачным, ускоряет взаимодействие и поддерживает мультимодальный ввод: текст, изображения и контекст до 1 миллиона токенов. При этом знания модели актуализированы по состоянию на июнь 2024 года, что гарантирует релевантность данных.

Конкуренция и перспективы

Запуск новых моделей Google происходит в условиях жёсткой конкуренции с такими решениями, как DeepSeek AI и ChatGPT-4o. Чтобы укрепить позиции, компания сделала ставку на мультимодальность Gemini 2.0 Pro, которая объединяет анализ текста, изображений и данных из поиска, что значительно улучшает понимание контекста. Например, при решении сложной задачи модель может сопоставить графики из исследования с последними научными статьями, найденными в Google Scholar. Это обновление не только усиливает технологическое лидерство Google, но и расширяет сценарии использования AI: от бытовых вопросов вроде планирования бюджета до профессиональных задач — анализа больших данных или генерации кода. Таким образом, Gemini постепенно трансформируется из инструмента в универсального цифрового помощника, способного адаптироваться к любым потребностям.