Estrai dati dai moduli PDF tramite Python

Estrai i campi di dati utente dal documento PDF compilabile. Usa Aspose.PDF per Python for .NET per modificare i file PDF a livello di codice

Come estrarre dati dai moduli PDF utilizzando la libreria Python for .NET

Per estrarre i dati da PDF Forms (Acroforms) in un file PDF, utilizzeremo l’API Aspose.PDF for .NET, che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma python-net. Puoi scaricare la versione più recente direttamente dal gestore di pacchetti NuGet, cercare Aspose.pdf e installarla. È inoltre possibile utilizzare il seguente comando dalla console di Package Manager.

Come estrarre AcroForm in PDF utilizzando Python


È necessario Aspose.PDF for .NET per provare il codice nel proprio ambiente.

  1. Carica il PDF in un’istanza della classe Document.
  2. Ottieni valori da tutti i campi usando la classe Document.Form.
  3. Analizza nomi e valori se necessario.
  4. Carica PDF in un’istanza della classe Document
  5. Ottieni valori da tutti i campi usando la classe Document.Form

Estrarre dati da moduli PDF - Python

Questo codice di esempio mostra come estrarre dati dai moduli PDF in PDF utilizzando Python

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")