Госструктуры отдают предпочтение малым языковым моделям, а не чат-ботам

микросхемы и серверные чипы, цифровая матрица, AI

Госструктурам обещают не очередной «умный чат», а способ заставить ИИ работать в их условиях. Ведомства упираются в безопасность, контроль данных, слабую инфраструктуру и местами почти музейную связь, поэтому большие языковые модели здесь часто выглядят как дорогая демонстрация для презентации, а не как рабочий инструмент.

Выходом авторы материала называют малые языковые модели, которые можно держать локально, кормить только нужными данными и не отправлять чувствительную информацию в облако. Это не романтика «модели поменьше», а попытка подогнать ИИ под госреальность, где сбой системы и утечка данных стоят заметно дороже, чем лишний процент точности.

Почему большие модели плохо подходят госструктурам

Capgemini указывает, что 79% руководителей в госсекторе по всему миру настороженно относятся к безопасности данных при работе с ИИ. И это не паранойя, а нормальная реакция на то, что у государства есть не только данные, но и юридическая ответственность за то, куда они утекают и кто к ним прикасается.

Проблема шире, чем просто «не доверяем облаку». Во многих учреждениях нет стабильного интернета, нет привычки управлять GPU-инфраструктурой, а непрерывность работы важнее, чем эффектная демонстрация возможностей модели. По оценке Elastic, 65% лидеров госсектора не могут использовать данные непрерывно в реальном времени и в масштабе, что для ИИ звучит почти как приговор.

На этом фоне большие языковые модели оказываются неудобными не по идеологии, а по бухгалтерии и эксплуатации. Они требуют больше вычислений, больше железа и больше доверия к центральной инфраструктуре, а государственные организации как раз пытаются свести к минимуму и риски, и зависимость от внешних площадок.

Что дают малые языковые модели

Малые языковые модели обычно считают в миллиардах параметров, а не в сотнях миллиардов, и именно поэтому они менее прожорливы. Их можно развернуть локально, заставить работать с проверенными источниками и встроить в поиск, а не в болтовню ради болтовни.

Gartner прогнозирует, что к 2027 году маленькие специализированные ИИ-модели будут использоваться в 3 раза чаще, чем LLM. Если прогноз сбудется, это будет не победа скромности, а банальная победа практичности: там, где нельзя размахивать мощью, побеждает модель, которая помещается в правила, аудит и локальный сервер.

Самая полезная часть этой истории, впрочем, не чат, а поиск. У госорганов тонны неструктурированных документов, от тендеров и отчётов до протоколов и счетов, и SLM-системы могут вытаскивать смысл даже из PDF, сканов, таблиц, изображений и записей, а потом ещё и собирать из этого юридически аккуратные ответы.

Здесь и начинается более взрослая версия ИИ для государства. Не «спроси у бота», а «найди, проверь, процитируй и не сломай процесс», что звучит куда менее глянцево, но куда ближе к реальной эксплуатации.

Поиск вместо чат-бота

Хан Сяо из Elastic предлагает довольно трезвый принцип: начинать не с чатбота, а с поиска. И это редкий случай, когда корпоративный совет не прячется за маркетингом, потому что для госструктур ценнее не «вау-эффект», а возможность находить нужное в собственных данных без лишних приключений.

Дальше вопрос уже не в том, может ли модель написать текст, а в том, можно ли ей доверить нормативы, общественные консультации, административные ответы и внутренние решения. Если ответ работает только с локальными данными, верифицируемыми источниками и документируемым поведением, то это уже не игрушка для демонстрации, а инфраструктура.

Именно поэтому история про ИИ в госсекторе сейчас смещается от гигантских универсальных моделей к более узким системам, которые можно контролировать, сертифицировать и держать под рукой. Судя по тому, как осторожно государства относятся к данным, дальше рынок будет продавать не мощь, а управляемость.

Источник: Technologyreview

Сергей Кузнецов

Главный редактор itzine.ru и технический журналист с 15-летним стажем. Специализируется на глубоком тестировании аудиооборудования, фототехники и потребительской электроники. Автор более 5000 материалов, охватывающих широкий спектр тем: от обзоров игровых кресел и сетевого оборудования до аналитики рынка смартфонов и носимых гаджетов. На платформе курирует экспертные разделы и формирует редакционную политику издания.