Extraire les données des formulaires PDF via Python

Extrayez les champs de données utilisateur d’un document PDF à remplir. Utilisez Aspose.PDF pour Python for .NET pour modifier les fichiers PDF par programmation

Comment extraire des données à partir de formulaires PDF à l'aide de la bibliothèque Python for .NET

Pour extraire des données de formulaires PDF (Acroforms) dans un fichier PDF, nous allons utiliser l’API Aspose.PDF for .NET, qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Vous pouvez télécharger sa dernière version directement depuis le gestionnaire de packages NuGet, rechercher Aspose.pdf et l’installer. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages.

Comment extraire AcroForm au format PDF à l’aide de Python


Vous avez besoin de Aspose.PDF for .NET pour essayer le code dans votre environnement.

  1. Chargez le PDF dans une instance de la classe Document.
  2. Récupère les valeurs de tous les champs en utilisant la classe Document.Form.
  3. Analysez les noms et les valeurs si nécessaire.
  4. Charger le PDF dans une instance de la classe Document
  5. Obtenir les valeurs de tous les champs à l’aide de la classe Document.Form

Extraire des données à partir de formulaires PDF - Python

Cet exemple de code montre comment extraire des données de formulaires PDF au format PDF à l'aide de Python

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")