
Xiaomi продолжает интенсивное развитие больших языковых моделей, анонсировав сразу три новых варианта: MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS. Главной новинкой стал MiMo-V2-Pro — флагман с более чем 1 ТБ параметров и контекстным окном в 1 МБ, ориентированный на сложные рабочие сценарии и автоматизацию в эпоху «агентов». Модель уже интегрируют в собственные продукты Xiaomi — браузер, Kingsoft Office, MiMo Studio — и открыли доступ для разработчиков через API с бесплатным недельным тестом.
MiMo-V2-Pro демонстрирует высокую производительность в сложных задачах, включая организацию рабочих процессов и долгосрочное планирование без участия человека. По заявлениям Xiaomi, по эффективности модель близка к Claude Opus 4.6, но стоимость использования API значительно ниже — от $1 за миллион токенов с учётом ширины контекстного окна. MiMo-V2-Pro уже внедрён в офисный пакет WPS Office для работы с Word, Excel, PowerPoint и PDF.
MiMo-V2-Omni — мультимодальная модель, способная одновременно анализировать аудио, изображения и видео. Она эффективно обрабатывает длинные аудиозаписи, распознает речь нескольких говорящих и обеспечивает комплексное восприятие видео. В ряде тестов аудиоаналитика MiMo-V2-Omni превосходит даже Gemini 3 Pro, что расширяет возможности применения модели в мультимедийных задачах.
MiMo-V2-TTS — модель синтеза речи с возможностью тонкой настройки тембра, эмоций и стиля произношения. Она воспроизводит естественную речь и даже пение на различных диалектах китайского языка, что выделяет её на фоне многих голосовых ассистентов.
Все три модели уже доступны через API Xiaomi по конкурентным ценам. Позиционирование показывает, что Xiaomi не просто догоняет лидеров в сфере искусственного интеллекта, а активно и системно интегрирует свои разработки в собственную экосистему и инструменты для разработчиков.