Extraer metadatos de PDF a través de Java

Cómo editar metadatos de PDF con la biblioteca de Java

Cómo extraer metadatos de PDF mediante la biblioteca de Java

Para extraer metadatos de archivos PDF, utilizaremos la API Aspose.PDF para Java, que es una API de conversión potente, fácil de usar y con muchas funciones para la plataforma Java. Puede descargar su última versión directamente desde [Maven](https://repository.aspose.com/webapp/ #/artifacts/browse/tree/general/repo/com/aspose/aspose-pdf) e instalarla en su proyecto basado en Maven añadiendo las siguientes configuraciones al pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extraer metadatos de PDF a través de Java


Necesita Aspose.PDF for Java para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Obtenga DocumentInfo mediante la propiedad Document.Info.
  3. Acceda y muestre diferentes propiedades de Document.Info.

<% metadata.code-block.text %>

Extraer metadatos de PDF: Java

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());