Estrai dati dai moduli PDF tramite Python

Estrai i campi dei dati utente dal documento PDF compilabile tramite Python. Crea le tue app Python for .NET utilizzando le API lato server.

Come estrarre dati dai moduli PDF utilizzando la libreria Python for .NET

Per estrarre i dati da PDF Forms (Acroforms) in un file PDF, utilizzeremo l’API Aspose.PDF for .NET, che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma python-net. Puoi scaricare la versione più recente direttamente dal gestore di pacchetti NuGet, cercare Aspose.pdf e installarla. È inoltre possibile utilizzare il seguente comando dalla console di Package Manager.

Come estrarre AcroForm in PDF utilizzando Python


È necessario Aspose.PDF for .NET per provare il codice nel proprio ambiente.

  1. Carica il PDF in un’istanza della classe Document.
  2. Ottieni valori da tutti i campi usando la classe Document.Form.
  3. Analizza nomi e valori se necessario.
  4. Carica PDF in un’istanza della classe Document
  5. Ottieni valori da tutti i campi usando la classe Document.Form

Estrarre dati da moduli PDF - Python

Questo codice di esempio mostra come estrarre dati dai moduli PDF in PDF utilizzando Python

    // Open document
    Document pdfDocument = new Document(dataDir + "GetValuesFromAllFields.pdf");

    // Get values from all fields
    foreach (Field formField in pdfDocument.Form)
    {
        // Analyze names and values if need
        Console.WriteLine("Field Name : {0} ", formField.PartialName);
        Console.WriteLine("Value : {0} ", formField.Value);
    }