Extrahieren Sie Daten aus PDF-Formularen über Python

Extrahieren Sie Benutzerdatenfelder aus einem ausfüllbaren PDF-Dokument. Verwenden Sie Aspose.PDF für Python for .NET, um PDF-Dateien programmgesteuert zu ändern

So extrahieren Sie Daten aus PDF-Formularen mithilfe der Bibliothek Python for .NET

Um Daten aus PDF-Formularen (Acroforms) in eine PDF-Datei zu extrahieren, verwenden wir die Aspose.PDF for .NET API, eine funktionsreiche, leistungsstarke und benutzerfreundliche API zur Dokumentenbearbeitung für die python-net -Plattform. Sie können die neueste Version direkt vom NuGet Paketmanager herunterladen, nach Aspose.pdf suchen und installieren. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

So extrahieren Sie AcroForm in PDF mit Python


Sie benötigen Aspose.PDF for .NET, um den Code in Ihrer Umgebung auszuprobieren.

  1. Laden Sie PDF in einer Instanz der Document-Klasse.
  2. Ruft Werte aus allen Feldern mit der Klasse Document.Form ab.
  3. Analysieren Sie bei Bedarf Namen und Werte.
  4. Laden Sie PDF in einer Instanz der Document-Klasse
  5. Ruft Werte aus allen Feldern mit der Klasse Document.Form ab

Daten aus PDF-Formularen extrahieren - Python

Dieser Beispielcode zeigt, wie mit Python Daten aus PDF-Formularen in PDF extrahiert werden

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")