Скачав из интернета документ Microsoft Word, часто обнаруживаешь, что его форматирование выполнено кое-как: в тексте присутствуют ненужные фрагменты, отступы слишком широкие или наоборот, отсутствуют пустые строки между абзацами. Так обычно бывает, когда документ был отсканирован и распознан, но не приведен в должную форму и в таком виде выложен в интернет. В таких случаях приходится доделывать за опубликовавшего файл пользователя его работу.
Нередко сталкиваясь с проблемами замены или удаления фрагментов контента, которые хотя и являются типовыми, на деле отличаются друг от друга.
Например, это могут быть гиперссылки, лишние пробелы, номера страниц и тому подобное. А еще в тексте могут встречаться ненужные изображения, от которых также следовало бы избавиться. В Microsoft Word имеется функция поиска и замены, но далеко не все умеют ею правильно пользоваться, точнее, не используют всех ее возможностей.
Заменять и удалять точные вхождения просто, а вот как, к примеру, одним махом удалить ссылки, которые имеют разные URL? Или как удалить из того же текста вставленные в него графические объекты? Такие операции в Word выполняются с помощью специальных подстановочных символов и регулярных выражений.
Удаление или замена графических элементов
На вкладке «Главная» в группе инструментов «Редактирование» нажмите «Заменить» и введите в поле «Найти» запрос ^g, а в поле «Заменить» ничего не вводите.
Нажмите «Заменить все», и все имеющиеся в документе изображения будут немедленно удалены.
Запрос ^g вводить руками необязательно, если в окошке поиска и замены нажать кнопку «Больше», откроется меню дополнительных параметров замены, о которых то как раз и забывают.
Нажав кнопку «Специальный», выберите в открывшемся списке опцию «Графический объект».
Поле запроса заполнится автоматически.
Удаление или замена гиперссылок
Похожим образом из текста удаляются гиперссылки, только подстановочные знаки используются другие, а именно звездочка и перевод абзаца.
Запрос же выглядит следующим образом: https*^13. https — это то, с чего нужно искать, * означает любое число знаков, следующих за первыми входящими в запрос символами, ^13 — соответствует знаку «конец строки». Зачем нужно указывать перевод абзаца? Чтобы Word знал, где заканчивается ссылка.
А если ссылка находится внутри предложения? Тогда еще всё проще: символ переноса строки на новый абзац не указывается, вместо него после звездочки ставится пробел.
Но, обращаем ваше внимание, что опция «Подстановочные знаки» в окошке поиска и замены должна быть включена.
Удаление или замена цифр
И еще один маленький пример использование выражений, позволяющих удалять из документов Word цифры.
Для этого используется очень простой запрос ^# без включения опции «Подстановочные знаки».
Если цифры заключены в скобки, сначала необходимо удалить цифры, а затем оставшиеся пустыми скобки, не забыв о пробеле между ними.
Найти в интернете списки подстановочных символов, а их более чем достаточно, не составляет проблемы, труднее научиться ими пользоваться. С помощью регулярных выражений и подстановочных символов можно составлять сложные запросы, но чтобы разобраться в их работе, придется потратить не один день.
Если ссылке https://www.white-windows.ru дать наименование "Сайт" , то в этом случае не удаляется. т.к. не находит https в тексте.