
Google DeepMind представил инновационную технологию, которая способна генерировать фоновую музыку и звуковые эффекты для немых видео. Эта система «видео-аудио» разработана, чтобы упростить процесс видеомонтажа, особенно для контент-креаторов.
DeepMind активно совершенствует технологию. В будущем планируется, чтобы ИИ автоматически генерировал звуки, основываясь исключительно на содержимом видео, устраняя необходимость в пользовательских подсказках. Также ведутся работы по улучшению синхронизации сгенерированных диалогов с движениями губ персонажей на видео.
Эта технология «видео-аудио» имеет потенциал революционизировать видеомонтаж, особенно для создателей контента, у которых нет доступа к профессиональным аудиоинструментам или экспертным знаниям. DeepMind делает шаги к тому, чтобы сделать процесс создания видео более доступным и эффективным.