Согласно статистике, средняя продолжительность жизни сайта в Интернете составляет порядка пяти лет, после чего домен либо перестает быть активным, либо его место занимает другой сайт. Естественно, что контент старого сайта при этом утрачивается, часто навсегда, если только кто-то из неравнодушных пользователей не сохранит его в базу знаменитого проекта Wayback Machine, принадлежащего некоммерческой организации The Internet Archive.
Начиная с 2001 года, Wayback Machine сохранил порядка 760 миллиардов веб-страниц и это только часть веб-контента. Дело в том, что в отличие от поисковых роботов Всемирной паутины, веб-краулеры сервиса сканируют сайты выборочно, поэтому многие страницы так и не попадают в его базу. К счастью, в Wayback Machine имеется опция, позволяющая сохранять веб-страницы в ручном режиме всем без исключения пользователям.
Как сохранить страницу в Wayback Machine
Сохранить веб-страницу в архив проекта очень просто.
Скопируйте ее URL-адрес, перейдите на сайт Wayback Machine web.archive.org/save, вставьте скопированный адрес в поле «Save Page Now» и нажмите кнопку «Save Page».
Опцию сохранения с ошибками можно отключить, большой роли она не играет. Сохранение обычно занимает меньше минуты, после чего сервис выдаст ссылку на заархивированный материал. Страница будет доступной всем, у кого есть ее адрес и кто захочет найти ее в базе Wayback Machine.
Больше возможностей получают зарегистрированные пользователи.
Помимо обычного сохранения, им будут доступны такие опции как сохранение страниц в персональное хранилище, добавление к архиву страницы скриншота, сохранение данных по найденным на странице ссылкам (кроме файлов) и отправка уведомлений email.
Правда, нужно отметить, что с предпоследней функцией в Wayback Machine тоже не всё гладко, – по какой-то причине сохранение некоторых страниц по ссылкам часто завершается ошибкой.
Если прибегать к архивированию веб-страниц приходится часто, рекомендуем установить бесплатное расширение Wayback Machine для Chrome, предварительно зарегистрировавшись в самом сервисе веб-архивации.
Расширение хорошо тем, что позволяет сохранять страницы без перехода на сайт Wayback Machine, также его панель содержит дополнительные опции сохранения и быстрые ссылки на ключевые разделы сервиса. Аналогичное расширение имеется и для Firefox, называется оно Wayback Machine by Internet Archive.
Как нетрудно догадаться, недостатком онлайн-архивирования является необходимость доступа к Интернету, кроме того, никто не может гарантировать, что сам проект Wayback Machine будет существовать вечно. Решением могло бы стать использование программы ArchiveBox, работающей по принципу Wayback Machine, с другой стороны, такой подход также не лишен недостатков. В настоящее время ArchiveBox доступен только для Linux (в Windows через Docker или WSL) и к тому же он не слишком удобен в использовании.
Добавить комментарий