МИФИ представил систему анализа неструктурированных данных
Источник изображения: GigaChat

НИЯУ МИФИ разработал систему интеллектуального анализа неструктурированных и разнородных данных, которая собирает из неструктурированных массивов связи, сущности и показатели и превращает их в пригодную для анализа модель. Разработка рассчитана на задачи госуправления, научной аналитики и оценки кооперации между организациями и странами. В вузе сообщили, что систему уже тестировали на данных по атомной энергетике, медицине и финансовой безопасности.

Система создана под руководством доктора технических наук Алексея Артамонова. По данным вуза, в ее основе лежит единая модель цифрового объекта: любой источник, от научной статьи и патента до профиля в соцсети, описывается через статические свойства, динамические показатели и граф связей. Такой подход нужен для работы с массивами, где значим не отдельный документ, а отношения между авторами, организациями, темами, цитированием и географией.

Разработка автоматически извлекает из текстов физические величины, координаты организаций, основные термины и сведения о международном сотрудничестве. Для визуализации команда сделала 3D-карты научных направлений, которые позволяют сравнивать динамику по странам, искать точки роста и смотреть на плотность кооперации. В текущей версии система использует классические методы машинного обучения, затем разработчики планируют добавить нейросетевые модели для более глубокого анализа контекста.

Спрос на такие инструменты растет и вне академической среды. По оценке Fortune Business Insights, мировой рынок big data analytics в 2025 году превышает $340 млрд и продолжает расти двузначными темпами. В России схожие задачи решают платформы Graph Tech от Сбера, продукты Yandex Cloud для анализа данных и отраслевые системы ИСП РАН, хотя МИФИ делает акцент именно на научно-технологической разведке и задачах государственного уровня.

Отдельная деталь в этой истории, редкая для университетских анонсов: систему ведут с 2008 года, а не собирают под очередную волну интереса к ИИ. Это сближает проект с государственными аналитическими платформами, где ценятся не эффектные демо, а длинная история данных и возможность работать с разнородными источниками. Практический результат станет понятнее по мере внедрения в ведомства и исследовательские центры, где сейчас идет гонка за инструменты технологического мониторинга и патентной аналитики.

Источник: Ixbt
Илья Игнатов
Технический журналист и новостник. Окончил МТУСИ по специальности «Информационная безопасность». Пишет о железе, софте и потребительской электронике с 2018 года. Верит, что хорошая новость — это когда всё по делу и без воды.

Leave a reply