MTS AI представил видеобота, способного находить ключевые моменты и события в длинных видеозаписях по текстовому описанию. Теперь пользователи могут загрузить видеофайл и сформулировать запрос, например: «Найди сцены с желтыми такси» или «Покажи момент, когда человек входит в комнату». Бот обрабатывает запрос за считанные секунды и предоставляет найденные фрагменты.
Это решение уже успешно протестировано на обширном наборе видео различной тематики. Видеобот способен обнаруживать до 80% событий на кадрах по запросу пользователя.
Как это работает?
В основе видеобота лежит инновационный подход к видеоаналитике. В отличие от существующих систем, которые ограничены узкими задачами (например, поиск предметов или детекция движения), видеобот от MTS AI способен искать любые визуальные сцены по их текстовому описанию на записях различной длины.
Решение базируется на нейросетевой модели CLIP, которая проецирует изображения и текстовые описания в единое векторное пространство. Пользовательский запрос преобразуется в вектор и сравнивается с векторами отдельных кадров видео. Искусственный интеллект определяет наиболее релевантные кадры и предоставляет итоговый результат.
Эта технология найдет широкое применение в различных индустриях, от безопасности до логистики, ритейла и онлайн-кинотеатров. Она позволит существенно ускорить аналитику длительных видеопотоков, сэкономить ресурсы и деньги компаний. В будущем MTS AI планирует развивать эту технологию, включая расширенную поддержку видео в режиме реального времени.
Доступность и тестирование
Видеобот уже доступен для использования. Чтобы протестировать его работу, переходите по адресу @CamerOn_Video_Search_Bot в Телеграме, загрузите видео и запросите интересующие кадры.