Extraia metadados de PDF via Java

Como editar metadados de PDF usando a biblioteca Java

Como extrair metadados de PDF usando a biblioteca Java

Para extrair metadados de arquivos PDF, usaremos a API Aspose.PDF for Java, que é uma API de conversão rica em recursos, poderosa e fácil de usar para a plataforma Java. Você pode baixar sua versão mais recente diretamente do [Maven](https://repository.aspose.com/webapp/ #/artifacts/browse/tree/general/repo/com/aspose/aspose-pdf) e instalá-la em seu projeto baseado em Maven adicionando as seguintes configurações ao pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extraia metadados de PDF via Java


Você precisa do Aspose.PDF for Java para testar o código em seu ambiente.

  1. Carregue o PDF com uma instância de Document.
  2. Obtenha DocumentInfo usando a propriedade Document.Info.
  3. Acesse e exiba propriedades diferentes do Document.Info.

<% metadata.code-block.text %>

Extraia metadados de PDF - Java

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());