МИФИ представил систему анализа неструктурированных данных

НИЯУ МИФИ разработал систему интеллектуального анализа неструктурированных и разнородных данных, которая собирает из неструктурированных массивов связи, сущности и показатели и превращает их в пригодную для анализа модель. Разработка рассчитана на задачи госуправления, научной аналитики и оценки кооперации между организациями и странами. В вузе сообщили, что систему уже тестировали на данных по атомной энергетике, медицине и финансовой безопасности.
Система создана под руководством доктора технических наук Алексея Артамонова. По данным вуза, в ее основе лежит единая модель цифрового объекта: любой источник, от научной статьи и патента до профиля в соцсети, описывается через статические свойства, динамические показатели и граф связей. Такой подход нужен для работы с массивами, где значим не отдельный документ, а отношения между авторами, организациями, темами, цитированием и географией.
Разработка автоматически извлекает из текстов физические величины, координаты организаций, основные термины и сведения о международном сотрудничестве. Для визуализации команда сделала 3D-карты научных направлений, которые позволяют сравнивать динамику по странам, искать точки роста и смотреть на плотность кооперации. В текущей версии система использует классические методы машинного обучения, затем разработчики планируют добавить нейросетевые модели для более глубокого анализа контекста.
Спрос на такие инструменты растет и вне академической среды. По оценке Fortune Business Insights, мировой рынок big data analytics в 2025 году превышает $340 млрд и продолжает расти двузначными темпами. В России схожие задачи решают платформы Graph Tech от Сбера, продукты Yandex Cloud для анализа данных и отраслевые системы ИСП РАН, хотя МИФИ делает акцент именно на научно-технологической разведке и задачах государственного уровня.
Отдельная деталь в этой истории, редкая для университетских анонсов: систему ведут с 2008 года, а не собирают под очередную волну интереса к ИИ. Это сближает проект с государственными аналитическими платформами, где ценятся не эффектные демо, а длинная история данных и возможность работать с разнородными источниками. Практический результат станет понятнее по мере внедрения в ведомства и исследовательские центры, где сейчас идет гонка за инструменты технологического мониторинга и патентной аналитики.


