Как распознать дипфейк, когда он всё лучше маскируется

Человек на компьютере с распознаванием дипфейка

Отличать настоящий фото- и видеоконтент от дипфейка становится сложнее не потому, что люди «невнимательны», а потому, что генеративные модели уже научились подделывать мелочи, которые раньше выдавали фальшивку сразу. На этом фоне старые советы про «посмотрите внимательнее» уже не работают: нужны инструменты проверки, а заодно — привычка замечать сбои в движении, свете и синхронизации речи. Если нужно быстро распознать дипфейк, начинать стоит именно с этих признаков.

Но и детекторы не панацея. Они часто ошибаются на плохом качестве, неидеальном обучающем наборе или при нехватке мимики, а значит, гонка между генерацией и распознаванием идет в обе стороны — как и у любого зрелого рынка ИИ, где защита неизбежно отстает от атакующих на полшага. В этой гонке полезнее всего сочетать автоматическую проверку и ручной анализ.

Инструменты для проверки дипфейков

Для начала стоит идти не к «чудо-боту», а к обычным веб-инструментам. В числе таких сервисов упоминаются Attestiv Video Platform, Sensity AI, Reality Defender и Deepware Scanner: они анализируют видео, изображения и аудио на несоответствия в освещении, цвете и пикселях. У Google есть и свой след в этой истории — SynthID detector умеет искать водяной знак в контенте, созданном сервисами Google AI вроде Veo, Imagen, Lyria и Gemini.

Есть и более приземленный путь: Google Search, Google Fact Check Explorer и Bing Visual Search помогают отследить происхождение картинки или ролика. Это не магия, а обычная проверка источника — часто куда полезнее, чем автоматический вердикт «подделка» или «настоящий», который сам по себе может быть ошибочным.

Признаки, которые выдают подделку

Самые заметные огрехи обычно прячутся в движении. В видео стоит смотреть на моргание: у взрослого человека в среднем оно происходит 15-20 раз в минуту, и слишком частые или, наоборот, неестественно редкие моргания уже повод насторожиться. Туда же идут несоответствия между губами и речью, странная мимика, искажения зубов и мелкие сбои в освещении или цвете кадра.

Если сомневаетесь в видеозвонке, попросите собеседника сделать сложный жест рукой или повернуть голову. Подделки до сих пор спотыкаются о такие «простые» вещи: могут поплыть уши, деформироваться лицо, а очки и украшения — начать жить собственной жизнью. И это, пожалуй, самый грустный тест для ИИ: красивую картинку он нарисует, а вот убедительно соврать человеческим телом ему всё еще труднее.

Что проверять первым делом

Источник файла: где впервые появился ролик или изображение.
Синхронизацию речи и губ.
Моргание, мимику и движения рук.
Странности в свете, цвете, зубах, очках и украшениях.
Результаты сразу нескольких инструментов, а не одного.

Дальше у этой истории будет только один сценарий: детекторы станут умнее, генераторы — еще убедительнее, а пользователю придется проверять контент так же буднично, как пароль от почты. Вопрос не в том, появятся ли более надежные способы распознавания, а в том, успеют ли они догнать поток синтетического мусора, который уже идет через интернет без перерыва.

Источник: Slashgear

Марта Баринова

Редактор новостного отдела, специализирующийся на аналитике программного обеспечения, стриминговых сервисов и изменениях в политике глобальных технологических платформ. В своих материалах Марта подробно освещает обновления Windows, функциональные изменения в Spotify и Google, а также исследует вопросы антимонопольного регулирования магазинов приложений. Автор более 140 публикаций, помогающих пользователям ориентироваться в быстро меняющемся ландшафте цифровых сервисов.