Wyodrębnij dane z formularzy PDF za pośrednictwem Python

Wyodrębnij pola danych użytkownika z dokumentu PDF, który można wypełnić. Użyj pliku Aspose.PDF dla Python for .NET, aby programowo modyfikować pliki PDF

Jak wyodrębnić dane z formularzy PDF za pomocą biblioteki Python

Aby wyodrębnić formularze PDF (Acroforms) w pliku PDF, użyjemy interfejsu API Aspose.PDF for Python via .NET, który jest bogatym w funkcje, potężnym i łatwym w użyciu interfejsem API do manipulacji dokumentami dla aplikacji Python. Możesz pobrać najnowszą wersję bezpośrednio z menedżera pakietów PyPi, wyszukać aspose-pdf i zainstalować. Możesz także użyć następującego polecenia z konsoli lub terminala.

Jak wyodrębnić program AcroForm w formacie PDF przy użyciu Python


Potrzebujesz Aspose.PDF for .NET, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF w wystąpieniu klasy Document.
  2. Uzyskaj wartości ze wszystkich pól używając klasy Document.Form.
  3. W razie potrzeby analizuj nazwy i wartości.
  4. Wczytywanie pliku PDF w wystąpieniu klasy Document
  5. Uzyskaj wartości ze wszystkich pól używając klasy Document.Form

Wyodrębnij dane z formularzy PDF - Python

Ten przykładowy kod pokazuje, jak wyodrębnić dane z formularzy PDF w formacie PDF przy użyciu Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)