Extraire les métadonnées PDF via Java

Comment modifier les métadonnées d’un PDF à l’aide de la bibliothèque Java

Comment extraire les métadonnées PDF à l'aide de la bibliothèque Java

Pour extraire des métadonnées à partir de fichiers PDF, nous utiliserons l’API Aspose.PDF pour Java, qui est une API de conversion riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme Java. Vous pouvez télécharger sa dernière version directement depuis Maven et l’installer dans votre projet basé sur Maven en ajoutant les configurations suivantes au pom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Extraire les métadonnées PDF via Java


Vous avez besoin de Aspose.PDF for Java pour essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Obtenir DocumentInfo à l’aide de la propriété Document.Info.
  3. Accédez aux différentes propriétés de Document.Info et affichez-la.

<% metadata.code-block.text %>

Extraire les métadonnées du PDF - Java

<% metadata.code-block.subtitle %>

Input file:

File not added

Output format:

Output file:


    Document pdfDocument = new Document(_dataDir + "sample.pdf");
    // Get document information
    DocumentInfo docInfo = pdfDocument.getInfo();
    // Show document information
    System.out.println("Author: " + docInfo.getAuthor());
    System.out.println("Creation Date: " + docInfo.getCreationDate());
    System.out.println("Keywords: " + docInfo.getKeywords());
    System.out.println("Modify Date: " + docInfo.getModDate());
    System.out.println("Subject: " + docInfo.getSubject());
    System.out.println("Title: " + docInfo.getTitle());