При работе с материалами сайтов пользователям нередко приходится копировать фрагменты текста со страницы. Казалось, что может быть проще копирования и вставки текста? Заветная комбинация клавиш Ctrl+C/Ctrl+V знакома каждому чайнику. Но встречаются и такие сайты, скопировать текст с которых обычным способом нельзя. Если вы попытаетесь скопировать текст с такого сайта, то у вас ничего не выйдет, так как его даже нельзя будет выделить.
Делается это вовсе не для того, чтобы испортить вам настроение, а с целью защиты от кражи контента, хотя по правде сказать, рассчитана такая защита разве что на новичков в компьютерных делах. Извлечь текст из такой странички не составляет особого труда, разве что времени на эту процедуру потребуется немного большею.
Извлечение текста из HTML-кода
То, чего не могут видеть пользователи, могут и должны видеть поисковые роботы. То бишь текст должен быть индексируемым. А раз так, его можно скопировать и использовать для своих нужд. Чтобы просмотреть исходный код страницы с текстом, нажмите комбинацию Ctrl+U, а затем отыщите в нём текст и скопируйте его обычным способом.
А чтобы не крутить страницу, воспользуйтесь обычным поиском. Скопированный таким способом текст может содержать теги, но от них очень просто избавиться, воспользовавшись любым бесплатным онлайн-инструментом для очистки тегов, например, сервисом 0en.ru.
Отключение JavaScript
Как правило, для защиты от копирования текста со страниц веб-мастера используют плагины, написанные на языке JavaScript. Отключите эту технологию в вашем браузере и после обновления страницы копирование текста станет доступным. В Google Chrome, например, это можно сделать в настройках контента.
Там же можно задать исключения для определённых сайтов.
Использование приложений для распознавания текста
В конце концов, для извлечения текстового контента можно воспользоваться любым инструментом для распознавания текста. Самым удобным из них является утилита ABBYY Screenshot Reader.
Она не бесплатна, но зато очень быстра и эффективна. Утилита эта представляет собой нечто вроде скриншотера, только она ещё вдобавок тут же распознаёт на сделанных снимках текст и передаёт его в буфер обмена, тем самым избавляя пользователя от необходимости загружать скриншот в программу или онлайн-сервис.
Добавить комментарий