Белый дом и Anthropic обсуждают проверку ИИ-моделей

Белый дом и структура, напоминающая колонны, в стиле Anthropic

Белый дом обсуждает с Anthropic процедуру, по которой власти США смогут оценивать риски новых ИИ-моделей до их широкого выпуска и вмешиваться, если обнаружат угрозы для нацбезопасности или экономики. Переговоры вышли на уровень технических стандартов после того, как США фактически заблокировали доступ к двум продвинутым моделям компании из-за спора о серьёзности уязвимостей. Для Anthropic это попытка вернуться в регуляторное поле без нового публичного конфликта с Вашингтоном.

Предмет обсуждения шире, чем список отдельных уязвимостей. Белый дом хочет закрепить две вещи: единые критерии оценки рисков и методику расчёта последствий, если злоумышленники используют модель для запрещённых задач. В исходном споре фигурировали опасения, что ограничения можно обойти и применить систему, в том числе для помощи в разработке биологического оружия.

Для рынка это важный сдвиг. До сих пор крупные разработчики в США в основном опирались на добровольные обязательства по тестированию и публикации отчётов о безопасности. Теперь Вашингтон, судя по ходу переговоров, пытается превратить такие практики в более формальную процедуру. Похожий поворот власти США наметили ещё в 2023 году, когда Anthropic, OpenAI, Google и Microsoft в Белом доме согласились на добровольные принципы тестирования мощных моделей.

Проверка ИИ-моделей в США

Поводом для нынешних консультаций стал конфликт недельной давности. Тогда специалисты Amazon обнаружили в модели Fable 5 уязвимости, которые, по версии американских властей, могли позволить обходить встроенные ограничения. Anthropic не согласилась с тем, что проблема носит критический характер, после чего власти настояли на закрытии доступа к двум передовым моделям для иностранных граждан.

Избирательно ограничить доступ компания не смогла, поэтому сервис пришлось закрыть для всех пользователей этих систем. Такой сценарий оказался чувствительным и для бизнеса, и для политики. Anthropic продаёт модели как через собственные сервисы, так и через облачные платформы партнёров, а простой даже на несколько дней бьёт по выручке и по репутации надёжного поставщика.

Здесь есть и отдельный корпоративный фон. Anthropic остаётся одним из крупнейших независимых игроков на рынке генеративного ИИ, хотя финансово давно опирается на стратегических партнёров. Amazon заявляла о планах инвестировать в компанию до $8 млрд, а Google ранее вложила в стартап более $2 млрд. Когда у такого разработчика возникают вопросы к безопасному выпуску моделей, тема автоматически становится не только регуляторной, но и инфраструктурной: его технологии уже встроены в чужие облака и корпоративные продукты.

В самой логике переговоров заметен разворот всей отрасли. После бума генеративного ИИ в 2023 и 2024 годах разработчики соревновались в скорости выпуска новых моделей, а власти ограничивались общими рамками. Теперь фокус смещается к процедурам предрелизной проверки. Аналогичный процесс идёт и в Европе, где AI Act вводит требования к оценке рисков для отдельных категорий систем, хотя американский подход пока выглядит более точечным и завязанным на переговорах с компаниями.

Для Anthropic это уже не первая встреча с повесткой «безопасность прежде релиза». Компания изначально строила бренд вокруг более осторожного развития ИИ и была основана выходцами из OpenAI, которые как раз делали акцент на управляемости моделей. Тем заметнее нынешний эпизод: стартап, долго говоривший о рисках, сам оказался в ситуации, когда его модели пришлось экстренно ограничивать.

Если Белый дом и Anthropic договорятся о шаблоне оценки уязвимостей, он почти неизбежно станет ориентиром и для остальных крупных игроков, включая OpenAI, Google DeepMind и Meta*. Это особенно вероятно на фоне того, что рынок генеративного ИИ быстро концентрируется вокруг нескольких поставщиков базовых моделей. По оценкам IDC, мировые расходы на ИИ-системы к 2028 году превысят $600 млрд, и без единой процедуры проверки регулятору придётся разбирать каждый конфликт вручную. Ответ на вопрос, станет ли нынешняя схема отраслевым стандартом, может появиться уже в ближайшие месяцы, когда США определят режим допуска для следующих поколений моделей.

* Принадлежит компании Meta, она признана экстремистской организацией в РФ и её деятельность запрещена.

Источник: 3dnews

Елизавета Добровольская

Автор itzine.ru с 2021 года. Пишет о смартфонах, гаджетах, железе, искусственном интеллекте и космосе — в общем, обо всём, что есть в мире технологий. От новостей о складных флагманах и процессорах до репортажей о культуре и рынке электромобилей. Следит за индустрией внимательно, но без фанатизма.