Помимо основной информации, файлы Microsoft Office и PDF могут содержать достаточно большое количество метаданных, фактически сведений о файлах. Эти данные включают в себя имя автора, название темы, ключевые слова, приложение, в котором был создан документ, время его создания и редактирования, количество страниц и так далее. В свойствах документов для просмотра доступна только малая часть этих данных.
Как извлечь данные из файлов PDF и Microsoft Office в MetaExtractor
