Бизнесмен смотрит графики использования ИИ на больших экранах
Изображение сгенерировано: Nano Banana

Компании, которые ускорили внедрение ИИ, столкнулись с новой задачей для финансового блока. По данным ещё не опубликованного исследования KPMG, только 26% организаций полностью понимают, сколько тратят на такие технологии. Остальные видят картину частично или уже после выставления счетов, когда повлиять на расходы почти нечем.

Проблема связана не только с темпами внедрения, но и с изменением самой модели закупок. Если корпоративное ПО долго продавалось по фиксированной подписке, то ИИ-сервисы всё чаще тарифицируются по фактическому потреблению. Базовой единицей расчёта стали токены, то есть фрагменты текста, которые модель обрабатывает на входе и выходе. Такой подход используют OpenAI и Anthropic, а вслед за ними Microsoft, Salesforce и другие поставщики корпоративных платформ.

Для вендоров это логичная схема: выручка ближе к реальной нагрузке на инфраструктуру. Для клиентов она создаёт другую проблему. Расходы перестают быть линейными и начинают зависеть от числа пользователей, длины запросов, настроек моделей, а также от того, насколько глубоко ИИ встроен в процессы разработки, поддержки и продаж.

Глобальный руководитель направления ИИ в KPMG Стив Чейз сообщил, что часть компаний за несколько месяцев исчерпала бюджеты, рассчитанные на весь год. В одном из случаев потребление токенов у клиента KPMG выросло в шесть раз за короткий период. Отдельная статья расходов, по его словам, — это облачные вычисления, которые быстро увеличиваются вслед за нагрузкой моделей и ИИ-агентов.

На практике эта проблема уже видна в публичных компаниях. Финансовый директор Life360 Рассел Бёрк рассказал, что компания меняет архитектуру ИИ-агентов и ищет способы сократить расход токенов, при этом мониторинга затрат в реальном времени у неё нет. В Affirm, напротив, после расширения использования ИИ для написания кода потребление токенов выросло почти сразу, и компания перешла к почти оперативному контролю расходов с еженедельной отчётностью для руководства.

Reckitt столкнулась с другой стороной той же проблемы. После запуска 12 решений для маркетинга компания обнаружила, что часть сотрудников через несколько недель вернулась к прежним инструментам, а одна из систем показала ограничения по качеству данных. Это не отменило инвестиции, но удлинило срок окупаемости и заставило внимательнее смотреть не только на сумму расходов, но и на фактическое использование.

Расходы на ИИ и токены

Ситуация напоминает предыдущую волну роста затрат на облака. Во время пандемии компании резко нарастили закупки сервисов для удалённой работы, а затем начали сокращать избыточные подписки и внедрять FinOps-подходы для контроля инфраструктурных расходов. Теперь тот же цикл повторяется в ИИ, только единицей перерасхода становятся не виртуальные машины, а токены, вызовы моделей и работа агентов.

Внешние оценки подтверждают масштаб сдвига. Gartner прогнозировала, что мировые расходы на генеративный ИИ в 2025 году достигнут $644 млрд, что на 76% больше год к году. При таких темпах даже умеренная ошибка в планировании превращается в заметную строку бюджета, особенно в компаниях, где ИИ начинают использовать не отдельные команды, а сотни сотрудников.

Есть и ещё один фактор. По данным Flexera, управление облачными расходами несколько лет подряд остаётся одной из главных проблем для ИТ-подразделений. ИИ добавляет к этой задаче новый слой: затраты сложнее привязать к конкретной бизнес-функции, поскольку одна и та же модель может одновременно обслуживать чат-бота поддержки, помощника разработчика и внутренний поиск по документам.

Поэтому компании начинают ограничивать число инструментов и концентрировать бюджет. Corning уже сузила перечень ИИ-сервисов, доступных сотрудникам, и направила средства на ограниченное число крупных проектов. Amer Sports, владелец брендов Arc’teryx и Salomon, выбрала более медленный сценарий внедрения в финансовых процессах, чтобы не получить неконтролируемый рост расходов на токены и агентов.

Следующий этап для крупных заказчиков, по сути, уже понятен. Им нужен отдельный контур учёта для ИИ, аналогичный тому, который раньше строили для облачной инфраструктуры: лимиты, детализация по подразделениям, контроль качества данных и сопоставление расхода токенов с бизнес-результатом. Без этого финансовый директор видит не систему инвестиций, а поток счетов с переменной нагрузкой.

В ближайшие 12 месяцев именно дисциплина учёта может стать главным фильтром для корпоративных ИИ-проектов. Те компании, которые научатся считать стоимость одного сценария, пользователя или агента, смогут продолжать масштабирование. Остальным, вероятно, придётся пройти через ту же фазу оптимизации, которую рынок уже видел в облачном ПО после всплеска спроса в 2020-2021 годах.

Источник: Ixbt
Артур Берг
Старший новостной редактор, специализирующийся на оперативной аналитике рынка электроники и игровых систем. За время работы опубликовал более 2800 статей, посвященных новинкам мобильной индустрии, носимым устройствам и развитию облачных технологий. Подробно освещает события крупнейших международных выставок, таких как IFA, и анализирует стратегии ведущих технологических брендов на российском и мировом рынках.

Leave a reply