Extrahieren Sie Daten aus PDF-Formularen über Python

Extrahieren Sie Benutzerdatenfelder aus einem ausfüllbaren PDF-Dokument. Verwenden Sie Aspose.PDF für Python for .NET, um PDF-Dateien programmgesteuert zu ändern

C# Java C++ Python

So extrahieren Sie Daten aus PDF-Formularen mithilfe der Python Library

Um PDF-Formulare (Acroforms) in eine PDF-Datei zu extrahieren, verwenden wir die Aspose.PDF for Python via .NET API, eine funktionsreiche, leistungsstarke und benutzerfreundliche API zur Dokumentenbearbeitung für die Python-App. Sie können die neueste Version direkt vom Paketmanager PyPI herunterladen, nach aspose-pdf suchen und installieren. Sie können auch den folgenden Befehl von der Konsole oder dem Terminal aus verwenden.

So extrahieren Sie AcroForm in PDF mit Python

Sie benötigen Aspose.PDF for .NET, um den Code in Ihrer Umgebung auszuprobieren.

Lädt PDF in eine Instanz der Document-Klasse.
Ruft Werte aus allen Feldern mit der Klasse Document.Form ab.
Analysieren Sie bei Bedarf Namen und Werte.
PDF in eine Instanz der Document-Klasse laden
Ruft Werte aus allen Feldern mit der Klasse Document.Form ab

Extrahieren Sie Daten aus PDF-Formularen - Python

Dieser Beispielcode zeigt, wie Sie Daten aus PDF-Formularen in PDF mit Python extrahieren

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)