
Российские учёные запустили пилотные проекты по обучению ИИ на археологических данных и обогащению больших языковых моделей данными археологической периодики. Об этом сообщил вице-президент РАН и директор Института археологии РАН Николай Макаров. Задача проекта, который поддерживает Минобрнауки, состоит в том, чтобы ИИ отвечал на запросы на основе проверенных академических данных, а не пересказывал случайные публикации из открытого интернета.
По словам Макарова, для историков и археологов главная польза ИИ в ближайшей перспективе будет не в «автономных открытиях», а в навигации по большим массивам эмпирических материалов. Археология работает с отчётами, статьями, каталогами находок и полевыми описаниями, и ориентироваться в этом массиве вручную сложно даже профильному специалисту.
В проект также входят смежные задачи. Речь идёт о систематизации визуальных материалов, включая изображения артефактов, и об использовании нейросетей при разведке для обработки космических снимков и данных дистанционного зондирования. Это направление развивается и за пределами России: спутниковая археология с элементами машинного обучения уже применялась для поиска памятников в Перу, Египте и на Ближнем Востоке.
Идея использовать ИИ как инструмент для работы с историческими данными не нова, но до практического внедрения в академической среде такие проекты доходят редко. Один из самых заметных примеров последних лет, система Ithaca от Google DeepMind, обучалась на древнегреческих надписях и помогала с датировкой и атрибуцией текстов. В России речь идёт о более широком классе данных, от научной периодики до изображений и геоданных.
Масштаб проекта будет зависеть от того, сколько верифицированных материалов удастся оцифровать и разметить. Для научных ИИ-систем это обычно главный узкий участок: модель можно дообучить быстро, а подготовка качественного корпуса занимает месяцы. Если пилот покажет рабочую точность, следующим шагом может стать отдельный поисково-аналитический сервис для исследователей и музеев.