Яндекс заплатит до миллиона рублей за уязвимости в своих нейросетях

Яндекс расширяет программу поиска уязвимостей и приглашает исследователей к участию в новом направлении «Охоты за ошибками», которое теперь охватывает генеративные нейросети. Впервые под прицел белых хакеров попадут модели YandexGPT, YandexART и вся инфраструктура, связанная с их работой.
За выявление серьёзных технических уязвимостей Яндекс готов платить до 1 миллиона рублей, в зависимости от их критичности и сложности воспроизведения.
Содержание
Что именно ищут в нейросетях
В рамках нового этапа «Охоты» исследователи смогут сосредоточиться на технических сбоях и логических уязвимостях, которые могут повлиять на работу или обучение моделей. В частности:
- Спровоцировать некорректное поведение модели
- Добиться её отказа или сбоя
- Получить доступ к внутренней конфигурации или служебным данным
- Нарушить работу других сервисов Яндекса через взаимодействие с моделью
Максимальная выплата предусмотрена за уязвимости, которые позволяют получить чувствительную информацию, такую как технический системный промт, конфигурации модели или данные из защищённых разделов инфраструктуры.
Важно: в рамках этой программы принимаются только технические отчёты. Жалобы на некорректные ответы голосового помощника Алиса или неудачные изображения в Шедевруме не рассматриваются.

Нейросети уже в 20+ сервисах Яндекса
Модели YandexGPT и YandexART активно внедряются в экосистему Яндекса. На их основе работают более 20 пользовательских и бизнес-сервисов, включая:
- Алису
- Поиск с нейросетью
- Яндекс Директ
- Yandex Cloud
- API-интеграции для сторонних разработчиков
Появление нейросетей в списке целей «Охоты за ошибками» — это шаг к открытой и независимой проверке безопасности, соответствующей строгим требованиям, которые Яндекс декларирует при разработке новых продуктов.
Безопасность — в основе подхода
Компания подчёркивает, что создаёт свои технологии с учётом принципов безопасной разработки. Безопасность проверяется на всех этапах — от архитектуры до внедрения. Яндекс исследует потенциальные уязвимости ещё до релиза и внедряет защиту от атак на ИИ.
Среди существующих мер защиты:
- Антиробот Яндекса — защита от DDoS-атак
- Центр мониторинга — выявление угроз и анализ подозрительной активности
- Регулярные внутренние аудиты — оценка уровня защищённости систем
Теперь же верификация ИИ-систем дополнена ещё одним инструментом — открытой проверкой от внешних специалистов.