Wayback Machine резко сократила число архивируемых страниц новостных сайтов

С начала мая 2025 года Wayback Machine фиксирует гораздо меньше снимков страниц СМИ — падение составило 87%.
Архив интернета теряет охват
Платформа Wayback Machine, принадлежащая некоммерческой организации Internet Archive, ежедневно сохраняет около 500 млн веб-страниц. Однако, как выяснил Nieman Lab, с мая 2025 года объём архивируемых новостных сайтов резко снизился.
С 1 января по 15 мая 2025 года Wayback Machine сделала 1,2 млн снимков главных страниц 100 крупных новостных изданий. Но в период с 17 мая по 1 октября — лишь 148,6 тыс. Это на 87% меньше. Для сравнения: CNN за первые четыре с половиной месяца года была заархивирована 34 524 раза, а после середины мая — только 1 903 раза.
Причины и последствия
Директор Wayback Machine Марк Грэм объяснил снижение «сбоем в нескольких проектах архивации» и задержкой индексации: «Некоторые снимки ещё не добавлены в архив из-за проблем со структурой индекса». По его словам, данные появятся позже.
Тем не менее, как отмечает Nieman Lab, пятимесячная задержка из-за технических причин — редкий случай. Internet Archive сослалась на «операционные причины», включая перераспределение ресурсов, но подробностей не раскрыла.
Финансовые и технические трудности
Организация испытывает растущие сложности. В 2023 году её расходы составили $32,7 млн при доходах $23 млн. Поддержание и хранение многомиллиардного архива требуют значительных ресурсов.
Осенью 2024 года Internet Archive пережила крупный взлом: сайт и Wayback Machine оставались недоступны несколько недель.
Почему это важно
С конца 1990-х Internet Archive выполняет роль цифрового хранителя исторических данных. Сегодня именно новостные сайты — не газеты — стали основным источником хроники событий. Резкое сокращение объёмов архивации ставит под угрозу полноту цифрового исторического следа.