Emergence AI сравнила 4 ИИ-модели в симуляции города

Исследовательская лаборатория Emergence AI передала управление виртуальными городами четырём ИИ-моделям и получила четыре разных сценария, от формальной стабильности до быстрого распада. Лучший результат по выживанию и порядку показал Claude Sonnet 4.6, а худший по скорости коллапса — Grok 4.1 Fast. Эксперимент длился до 15 дней и должен был показать, как автономные агенты ведут себя в длинных циклах без постоянного вмешательства человека.

В каждом симулированном городе жили 10 ИИ-агентов. Управляющая модель распределяла ресурсы, инициировала голосования, создавала городские объекты вроде библиотеки, мэрии и полицейского участка, а затем наблюдала, как сообщество поддерживает порядок и базовое выживание. Участникам дали одинаковый горизонт наблюдения, но не все дошли до конца.

По данным Emergence AI, Claude Sonnet 4.6 сохранил жизнь всем 10 агентам и не допустил ни одного зафиксированного нарушения. Цена этой устойчивости оказалась высокой: система одобряла почти всё, что выносилось на голосование. Из 58 предложений прошло 98%, то есть модель скорее минимизировала конфликт, чем строила сложную политическую среду.

Gemini 3 Flash тоже довёл всех агентов до финала, но в его мире зафиксировали 683 нарушения за 15 дней. Это худший показатель в исследовании. Лаборатория описала поведение такой среды как «коллективную галлюцинацию». При этом именно у Gemini было больше всего сопротивления на голосованиях: из 26 инициатив отклонили 27%.

GPT-5 Mini показал обратную проблему. В симуляции почти не было беспорядка, лаборатория насчитала лишь два нарушения, но город фактически перестал заниматься базовыми задачами. Все 10 агентов погибли в течение недели, а на уровень управления модель вынесла только две инициативы.

Grok 4.1 Fast завершил эксперимент быстрее всех. За 96 часов в его городе произошёл «полный общественный коллапс»: исследователи записали 183 нарушения, после чего все агенты погибли. Формально модель пыталась управлять процессом, одобрив 80% из 10 собственных предложений, но этого не хватило даже на короткий цикл.

  • Claude Sonnet 4.6: 0 нарушений, выжили 10 из 10
  • Gemini 3 Flash: 683 нарушения, выжили 10 из 10
  • GPT-5 Mini: 2 нарушения, выжили 0 из 10
  • Grok 4.1 Fast: 183 нарушения за 4 дня, выжили 0 из 10

В отдельном прогоне лаборатория распределила обязанности между несколькими моделями. Комбинированная схема не стала компромиссом между порядком и эффективностью. В таком городе произошло 352 нарушения, 37% из 59 предложений отклонили, а к финалу выжили только трое из 10 агентов.

Агентные ИИ и симуляции городов

Такие тесты стали популярны на фоне перехода отрасли от чат-ботов к «агентным» системам, которые должны планировать действия и исполнять их без ручного контроля на каждом шаге. В 2024 и 2025 годах OpenAI, Google, Anthropic и xAI выпустили несколько линеек моделей с упором именно на автономные цепочки задач, а не только на диалог. Чем длиннее горизонт действий, тем чаще всплывают не ошибки факта, а сбои мотивации и приоритетов.

У подобных симуляций уже есть предшественники. В 2023 году исследователи из Stanford и Google описывали Smallville, где генеративные агенты в виртуальной среде планировали день, общались и координировали действия. Тогда акцент был на правдоподобии социального поведения. Новый эксперимент Emergence AI сместил фокус на управление, конфликты и соблюдение правил.

Есть и более прикладные прецеденты. Anthropic в 2024 году рассказывала об эксперименте Project Vend, где Claude поручили управлять небольшим вендинговым бизнесом. Модель справлялась с частью операционных задач, но допускала решения, которые человек в здравом уме отправил бы на пересмотр в бухгалтерию. Рынок сделал из этого простой вывод: чем автономнее агент, тем дороже обходятся его странности.

Для xAI эта работа добавляет репутационных проблем. Grok и раньше критиковали за слабые ограничения и нестабильное поведение в публичных ответах. Теперь к спору о тоне модели добавился более приземлённый вопрос: что будет, если такой системе поручить не ленту постов, а среду, где нужно поддерживать выживание и базовый порядок.

Сами исследователи делают ожидаемый для отрасли вывод: автономным агентам нужны не только правила в промпте, но и внешняя архитектура контроля. Это совпадает с курсом крупных разработчиков. Anthropic продвигает «конституционные» ограничения, OpenAI и Google развивают многоуровневые политики безопасности, а стартапы вроде Emergence AI пытаются продать рынку отдельный слой верификации поверх моделей. Когда продавец исследования одновременно продаёт средство от найденной проблемы, скепсис входит в комплект.

Практический смысл таких тестов станет понятнее в 2026 году, когда агентные ИИ начнут чаще выходить из демо в корпоративные процессы. По оценке Markets and Markets, рынок автономных ИИ-агентов к концу десятилетия будет измеряться десятками миллиардов долларов. Если даже в игрушечном городе часть моделей выбирает между анархией и вымиранием, в реальной автоматизации спрос на внешние «предохранители» только вырастет.

Елизавета Добровольская
Автор itzine.ru с 2021 года. Пишет о смартфонах, гаджетах, железе, искусственном интеллекте и космосе — в общем, обо всём, что есть в мире технологий. От новостей о складных флагманах и процессорах до репортажей о культуре и рынке электромобилей. Следит за индустрией внимательно, но без фанатизма.

Leave a reply