Извлечение метаданных PDF с помощью Java

Извлеките метаданные из PDF-документа. Используйте Aspose.PDF для Java для программного изменения PDF-файлов

Как извлечь метаданные PDF с помощью библиотеки Java

Извлеките метаданные из PDF с помощью Aspose.PDF для Java. Доступ к метаданным документа означает получение информации об этом файле, такой как его название, автор, время создания и конкретные ключевые слова. Извлечение метаданных помогает более эффективно организовать большую коллекцию PDF-файлов. Данные, извлеченные из метаданных, улучшают поиск файлов. Пользователи могут быстро находить определенные документы, используя ключевые слова или сведения, содержащиеся в извлеченных метаданных. Извлечение метаданных дает ценную информацию о том, что содержится в файле. В нем может содержаться краткое описание основных сведений о файле, что упростит понимание сути документа без необходимости его открывать. Извлечение метаданных помогает обеспечить подлинность документа. Можно проверить такие сведения, как имя автора на момент его создания или историю изменений. Эта проверка крайне важна для подтверждения надежности PDF-файла. Предоставляя краткие сведения о содержимом PDF-файла, извлеченные метаданные значительно улучшают пользовательский интерфейс. Это помогает пользователям легко идентифицировать документы и работать с ними. В целом извлечение метаданных PDF дает множество преимуществ, таких как более эффективное управление документами, улучшенные возможности поиска, соответствие стандартам и общее улучшение пользовательского интерфейса. Извлекайте метаданные из PDF с помощью Aspose и решайте все необходимые задачи при работе с данными. Для извлечения метаданных из PDF-файлов мы будем использовать API Aspose.PDF для Java, который представляет собой многофункциональный, мощный и простой в использовании API преобразования для платформы Java. Последнюю версию программы можно загрузить непосредственно с сайта Maven и установить ее в свой проект на базе Maven, добавив в файл pom.xml следующие конфигурации.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Извлечение метаданных PDF с помощью Java


Вам понадобится Aspose.PDF for Java, чтобы попробовать код в своей среде.

  1. Загрузите PDF-файл с экземпляром документа.
  2. Получить DocumentInfo с помощью свойства Document.
  3. Доступ и отображение различных свойств Document.Info.

Приведенный фрагмент кода Java показывает, как извлекать метаданные из PDF с помощью библиотеки Aspose.PDF. Он открывает PDF-файл с именем «GetFileInfo.pdf», расположенный в каталоге, указанном переменной DIR_INPUT_METADATAA. Код извлекает различные сведения из документа с помощью функции «info». Он отображает определенную метаинформацию из PDF-файла, такую как имя автора, дата создания, ключевые слова, дата изменения, тема и заголовок. Для отображения этой информации в коде используется функция «печать». Этот фрагмент кода представляет собой упрощенный пример использования библиотеки или фреймворка Aspose.PDF для извлечения метаданных из PDF-файла.

Извлечь метаданные из PDF — Java

В этом примере кода показано, как извлечь метаданные из PDF-файла

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());