Extraire des données de formulaires PDF via Java

Extrayez les champs de données utilisateur d’un document PDF à remplir. Utilisez Aspose.PDF pour Java pour modifier les fichiers PDF par programmation

Comment extraire des données de formulaires PDF à l'aide de la bibliothèque Java

Afin d’extraire des données à partir de formulaires PDF (Acroforms), nous utiliserons l’API Aspose.PDF pour Java qui est une API de conversion riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme Java. Vous pouvez télécharger sa dernière version directement depuis Maven et l’installer dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml.

Comment extraire AcroForm en PDF à l’aide de Java


Vous avez besoin de Aspose.PDF pour Java pour essayer le code dans votre environnement.

  1. Chargez le PDF dans une instance de la classe Document.
  2. Obtenez les valeurs de tous les champs à l’aide de la classe Document.Form.
  3. Analysez les noms et les valeurs si nécessaire.
  4. Charger un PDF dans une instance de la classe Document
  5. Obtenez les valeurs de tous les champs à l’aide de la classe Document.Form

Extraire des données à partir de formulaires PDF - Java

Cet exemple de code montre comment extraire des données de formulaires PDF au format PDF à l'aide de Java

// Open document
String inputFile = DATA_DIR.resolve("sample.pdf").toString();
try (Document pdfDocument = new Document(inputFile)) {

    // Get values from all fields
    for (WidgetAnnotation field : pdfDocument.getForm()) {
        // Cast to FormField
        Field formField = (Field) field;
        // Analyze names and values if needed
        System.out.println("Field Name : " + formField.getPartialName());
        System.out.println("Value : " + formField.getValue());
    }
}