Прошёл год с момента анонса модели Sora, и теперь OpenAI выпустила её первую крупную версию под названием Sora 2. Новая модель создаёт более реалистичные и физически точные видео, а также предлагает улучшенное управление и расширенные возможности редактирования. Дополнительно улучшена генерация звука: речь и звуковые эффекты теперь синхронизированы с изображением.

Компания описывает обновление как качественный скачок, сравнимый с переходом от GPT-3 к GPT-3.5. Генерируемые ролики могут следовать сложным инструкциям для нескольких сцен и сохранять единый стиль и сюжет. Поддерживаются разные форматы видео, включая реалистичный, кинематографичный и аниме.

Основные новшества Sora 2: более естественная физика объектов без искажений, улучшенный звук, расширенные инструменты редактирования и контроля. Пользователи смогут добавлять собственные изображения или видео в качестве «камео» с возможностью отозвать разрешение в любой момент. Встроены и защитные меры: нельзя использовать образы публичных людей без их согласия.

Запуск Sora 2 начался сегодня и пока ограничен США и Канадой. На старте сервис будет бесплатным с определёнными лимитами. Подписчики ChatGPT Pro получат доступ к версии Sora 2 Pro с более высоким качеством. В ближайшее время OpenAI обещает выпустить и API для разработчиков. Также появится отдельное приложение для iOS, доступное пока по системе приглашений.