Веб-сайты, даже если закрываются и удаляются с хостинга, не исчезают бесследно. Большинство из них еще при жизни становятся частью некоммерческого архива Wayback Machine, содержащего в своей базе более 850 миллиардов страниц из более чем 380 миллионов веб-сайтов. Wayback Machine – самый узнаваемый и популярный, но далеко не единственный ресурс, задачей которого является архивирование веб-контента.
Существуют и другие похожие проекты, с некоторыми из которых мы предлагаем познакомиться.
Содержание статьи:
Archive.today
Этот бесплатный веб-архив был создан в 2011 году как более функциональная альтернатива Wayback Machine. В отличие от последнего, Archive.today сохраняет веб-страницы в более полном виде, с большим количеством графики, медиа и что немаловажно – со скриптами Javascript.
Помимо страниц со ссылками, архив также хранит их скриншоты, ресурсом поддерживается ручное добавление URL, просмотр истории, поиск по ключевым словам. На данный момен в базе Archive.today имеется более 50 миллиардов веб-страниц, однако архив проявляет значительно меньшую активность, чем тот же Wayback Machine.
iTools
Оригинальный, но не слишком удобный веб-архив, предназначенный не столь для просмотра, сколь для анализа веб-сайтов. Ресурсом поддерживается получение сведений о посещаемости, рейтинге в Alexa, объеме трафика и репутации архивированных сайтов, кроме того, iTools отличается широким набором инструментов поиска и фильтрации.
iTools был запущен в 2009 году и в настоящее время содержит более 100 миллиардов страниц. Функционален и это плюс, с другой стороны, он больше подходит для веб-мастеров, чем для рядовых пользователей.
Веб-архив
Бесплатный русскоязычный веб-архив, созданный в 2016 году и предназначенный для доступа к архивным копиям страниц. В базу ресурса веб-страницы добавляются автоматически, также возможно добавление URL в ручном режиме.
Веб-архив.RU позиционируется как один из крупнейших архивов Интернета в России, но судя по всему, особой популярностью он не пользуется.
WebCite
Один из старейших и все еще действующих, хотя и в ограниченном объеме, веб-архивов Интернета. Сегодня WebCite позиционируется как площадка для авторов, издателей, редакторов и журналистов. Сайт хранит веб-страницы в упрощенном виде – только текст, гиперссылки и CSS, ресурсом поддерживается сохранение страниц в PDF, XML и ZIP, сравнение копий для отслеживания изменений.
В 2018 году WebCite прекратил сканирование Интернета, однако все те сайты и страницы, которые были добавлены в базу до 2018 года, по-прежнему доступны.
Time Travel
Еще один бесплатный и очень старый веб-ресурс, позволяющий заглянуть в прошлое и увидеть, как выглядел тот или иной сайт на указанную дату и время.
В настоящее время Time Travel представляет собой лишь интерфейс и, похоже, не имеет собственной базы, используя базу Wayback Machine.
http://timetravel.mementoweb.org
Список веб-архивов Интернета можно было продолжать и дальше – таких ресурсов на просторах глобальной сети имеется несколько десятков, причем не только бесплатных, но и предлагающих доступ по подписке. Платные архивы, как правило, являются специализированными, заточенными под поиск специфического контента, например, научного или финансового.
Также они могут предлагать различные дополнительные функции интеграции с облачными хранилищами, предоставлять API, возможности анализа и конвертации в PDF и так далее. Возможно, кто-то действительно найдет их полезными, но как показывает практика, большинство пользователей вполне удовлетворяют возможности Wayback Machine, иначе как объяснить его популярность.
Добавить комментарий