Wyodrębnij dane z formularzy PDF za pomocą Python

Wyodrębnij pola danych użytkownika z dokumentu PDF, który można wypełnić. Użyj pliku Aspose.PDF dla Python for .NET, aby programowo modyfikować pliki PDF

Jak wyodrębnić dane z formularzy PDF za pomocą biblioteki Python for .NET

Aby wyodrębnić dane z formularzy PDF (Acroforms) w pliku PDF, użyjemy Aspose.PDF for .NET API, który jest bogatym w funkcje, potężnym i łatwym w użyciu interfejsem API manipulacji dokumentami dla platformy python-net. Możesz pobrać jego najnowszą wersję bezpośrednio z menedżera pakietów NuGet, wyszukać Aspose.pdf i zainstalować. Można również użyć następującego polecenia z konsoli Package Manager Console.

Jak wyodrębnić AcroForm w formacie PDF za pomocą Python


Potrzebujesz Aspose.PDF dla .NET, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF w instancji klasy Document.
  2. Pobierz wartości ze wszystkich pól za pomocą klasy „Document.Form`.
  3. W razie potrzeby przeanalizuj nazwy i wartości.
  4. Załaduj plik PDF w instancji klasy Document
  5. Pobierz wartości ze wszystkich pól za pomocą klasy „Document.Form`

Wyodrębnij dane z formularzy PDF - Python

Ten przykładowy kod pokazuje, jak wyodrębnić dane z formularzy PDF w formacie PDF za pomocą Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)