Команда «ВКонтакте» объявила о запуске фильтра угроз в комментариях сообществ. Он доступен только администраторам и владельцем групп Вконтакте.
Этот фильтр может блокировать комментарии, содержащие различные угрозы жизни и здоровью, а также призывы к насилию. Администраторы сообществ могут включить и отключить фильтр в настройках сообщества (по умолчанию он отключён). Пока что функция доступна половине владельцев сообществ Вконтакте, но позже она появится и у остальных.
Разработчики пообещали продолжить улучшать этот фильтр. Со временем он научиться блокировать комментарии, связанные с разжиганием межнациональных и межэтнических конфликтов.
Тестирование фильтра идёт с ноября 2020 года. По словам разработчиков нейросеть правильно определяет угрозы в 80% случаев. В любом случае, администраторы сообществ могут восстановить заблокированные комментарии. Но в ходе теста таких случаев был всего 1%.