Открытая ИИ-модель Bridgewater обошла коммерческие аналоги

Группа аналитиков в офисе с цифровыми графиками Bridgewater

Bridgewater Associates и Thinking Machines Lab, основанная Мирой Мурати, сообщили, что специализированная модель с открытыми весами точнее и лучше справляется с финансовым анализом, чем крупные коммерческие ИИ. По внутреннему исследованию команд дообученная система на базе Qwen3-235B набрала 84,7% точности против 78,2% у лучшего коммерческого конкурента. И ещё один момент: на задачу уходит почти в 14 раз меньше вычислений. Для узких корпоративных сценариев это уже не абстрактный плюс, а вполне понятная экономия, где ошибка быстро превращается в деньги.

Исследование посвящено одной из самых скучных и дорогих задач для инвестиционных команд: нужно вытащить важное из потока новостей, отчётности, писем регуляторов и обзоров. Авторы описали шесть типовых сценариев из ежедневной работы инвесторов — от оценки того, насколько корпоративная новость важна для руководства компании, до поиска сигналов о возможном изменении ставок в документах центробанков. На таких кейсах, где эксперт часто работает по наитию, универсальные модели показали около 50% при простых промптах и примерно 75% после усложнённых инструкций и трёхуровневой шкалы важности.

Для улучшения качества команда не пошла по простому пути «давайте соберём больше данных». Сначала документы размечали внешние подрядчики, но набор вышел слабым. Тогда исследователи прогнали его через промежуточную модель, нашли самые вероятные ошибки разметки и отправили на ручную проверку только спорные случаи. После этого открытая Qwen3-235B, дообученная на платформе Tinker, обошла коммерческие системы по точности и, по оценке авторов, оказалась заметно дешевле в эксплуатации. В работе отдельно сказано, что это внутренняя методология, а не независимый внешний бенчмарк.

Само наблюдение, впрочем, не новое. Ещё в 2023 году Bloomberg представила BloombergGPT — отдельную модель для финансовых задач, и тогда стало понятно, что универсальный ИИ в нишах с дорогими доменными данными не всегда выходит в лидеры. Похожим путём шли и открытые проекты вроде FinGPT, которые адаптировали LLM под аналитику рынка и новостной сентимент. Разница в том, что теперь этот вывод подтверждает один из крупнейших хедж-фондов мира, причём на данных из реального корпоративного контура.

Для OpenAI, Anthropic и Google это неприятный, но показательный сигнал: в корпоративном сегменте борьба идёт не только за размер модели, но и за доступ к закрытым данным клиентов. По оценке Bloomberg Intelligence, рынок генеративного ИИ может приблизиться к $1,3 трлн к 2032 году, и заметная часть этих денег уйдёт не в самый общий чат-бот, а в дообученные системы для медицины, права и финансов. Если результаты Bridgewater подтвердят другие игроки, спрос на открытые модели с тонкой настройкой внутри компаний вырастет быстрее, чем на ещё одну дорогую универсальную LLM.

Марта Баринова

Редактор новостного отдела, специализирующийся на аналитике программного обеспечения, стриминговых сервисов и изменениях в политике глобальных технологических платформ. В своих материалах Марта подробно освещает обновления Windows, функциональные изменения в Spotify и Google, а также исследует вопросы антимонопольного регулирования магазинов приложений. Автор более 140 публикаций, помогающих пользователям ориентироваться в быстро меняющемся ландшафте цифровых сервисов.