Extraire les données des formulaires PDF via Python

Extrayez les champs de données utilisateur d’un document PDF à remplir via Python. Créez vos propres applications Python for .NET à l’aide d’API côté serveur.

Comment extraire des données à partir de formulaires PDF à l'aide de la bibliothèque Python for .NET

Pour extraire des données de formulaires PDF (Acroforms) dans un fichier PDF, nous allons utiliser l’API Aspose.PDF for .NET, qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Vous pouvez télécharger sa dernière version directement depuis le gestionnaire de packages NuGet, rechercher Aspose.pdf et l’installer. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages.

Comment extraire AcroForm au format PDF à l’aide de Python


Vous avez besoin de Aspose.PDF for .NET pour essayer le code dans votre environnement.

  1. Chargez le PDF dans une instance de la classe Document.
  2. Récupère les valeurs de tous les champs en utilisant la classe Document.Form.
  3. Analysez les noms et les valeurs si nécessaire.
  4. Charger le PDF dans une instance de la classe Document
  5. Obtenir les valeurs de tous les champs à l’aide de la classe Document.Form

Extraire des données à partir de formulaires PDF - Python

Cet exemple de code montre comment extraire des données de formulaires PDF au format PDF à l'aide de Python

    // Open document
    Document pdfDocument = new Document(dataDir + "GetValuesFromAllFields.pdf");

    // Get values from all fields
    foreach (Field formField in pdfDocument.Form)
    {
        // Analyze names and values if need
        Console.WriteLine("Field Name : {0} ", formField.PartialName);
        Console.WriteLine("Value : {0} ", formField.Value);
    }