Яндекс заплатит до миллиона рублей за уязвимости в своих нейросетях

Экранная панель с нейросетью Яндекс на дисплее, оранжевые линии и светящиеся узлы

Яндекс расширяет программу поиска уязвимостей и приглашает исследователей к участию в новом направлении «Охоты за ошибками», которое теперь охватывает генеративные нейросети. Впервые под прицел белых хакеров попадут модели YandexGPT, YandexART и вся инфраструктура, связанная с их работой.

За выявление серьёзных технических уязвимостей Яндекс готов платить до 1 миллиона рублей, в зависимости от их критичности и сложности воспроизведения.

Что именно ищут в нейросетях

В рамках нового этапа «Охоты» исследователи смогут сосредоточиться на технических сбоях и логических уязвимостях, которые могут повлиять на работу или обучение моделей. В частности:

Спровоцировать некорректное поведение модели
Добиться её отказа или сбоя
Получить доступ к внутренней конфигурации или служебным данным
Нарушить работу других сервисов Яндекса через взаимодействие с моделью

Максимальная выплата предусмотрена за уязвимости, которые позволяют получить чувствительную информацию, такую как технический системный промт, конфигурации модели или данные из защищённых разделов инфраструктуры.

Важно: в рамках этой программы принимаются только технические отчёты. Жалобы на некорректные ответы голосового помощника Алиса или неудачные изображения в Шедевруме не рассматриваются.

Рука держит белый планшет Redmi K Pad сбоку

Нейросети уже в 20+ сервисах Яндекса

Модели YandexGPT и YandexART активно внедряются в экосистему Яндекса. На их основе работают более 20 пользовательских и бизнес-сервисов, включая:

Алису
Поиск с нейросетью
Яндекс Директ
Yandex Cloud
API-интеграции для сторонних разработчиков

Появление нейросетей в списке целей «Охоты за ошибками» — это шаг к открытой и независимой проверке безопасности, соответствующей строгим требованиям, которые Яндекс декларирует при разработке новых продуктов.

Безопасность — в основе подхода

Компания подчёркивает, что создаёт свои технологии с учётом принципов безопасной разработки. Безопасность проверяется на всех этапах — от архитектуры до внедрения. Яндекс исследует потенциальные уязвимости ещё до релиза и внедряет защиту от атак на ИИ.

Среди существующих мер защиты:

Антиробот Яндекса — защита от DDoS-атак
Центр мониторинга — выявление угроз и анализ подозрительной активности
Регулярные внутренние аудиты — оценка уровня защищённости систем

Теперь же верификация ИИ-систем дополнена ещё одним инструментом — открытой проверкой от внешних специалистов.

Сергей Кузнецов

Главный редактор itzine.ru и технический журналист с 15-летним стажем. Специализируется на глубоком тестировании аудиооборудования, фототехники и потребительской электроники. Автор более 5000 материалов, охватывающих широкий спектр тем: от обзоров игровых кресел и сетевого оборудования до аналитики рынка смартфонов и носимых гаджетов. На платформе курирует экспертные разделы и формирует редакционную политику издания.