Estrai dati dai moduli PDF tramite Python

Estrai i campi di dati utente dal documento PDF compilabile. Usa Aspose.PDF per Python for .NET per modificare i file PDF a livello di programmazione

Come estrarre dati da moduli PDF utilizzando la libreria Python

Per estrarre i moduli PDF (Acroforms) in un file PDF, utilizzeremo l’API Aspose.PDF per Python via .NET, un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per l’app Python. Puoi scaricare l’ultima versione direttamente dal gestore di pacchetti PyPI, cercare aspose-pdf e installarlo. Puoi anche usare il seguente comando dalla console o dal terminale.

Come estrarre AcroForm in PDF usando Python


È necessario Aspose.PDF for .NET per provare il codice nel proprio ambiente.

  1. Carica il PDF in un’istanza della classe Document.
  2. Ottieni valori da tutti i campi usando la classe Document.Form.
  3. Analizza nomi e valori se necessario.
  4. Carica il PDF in un’istanza della classe Document
  5. Ottieni valori da tutti i campi usando la classe Document.Form

Estrai dati da moduli PDF - Python

Questo codice di esempio mostra come estrarre dati da moduli PDF in PDF utilizzando Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)