Wyodrębnij dane z formularzy PDF za pomocą Python

Wyodrębnij pola danych użytkownika z dokumentu PDF, który można wypełnić. Użyj pliku Aspose.PDF dla Python for .NET, aby programowo modyfikować pliki PDF

Jak wyodrębnić dane z formularzy PDF za pomocą biblioteki Python for .NET

Aby wyodrębnić dane z formularzy PDF (Acroforms) w pliku PDF, użyjemy Aspose.PDF for .NET API, który jest bogatym w funkcje, potężnym i łatwym w użyciu interfejsem API manipulacji dokumentami dla platformy python-net. Możesz pobrać jego najnowszą wersję bezpośrednio z menedżera pakietów NuGet, wyszukać Aspose.pdf i zainstalować. Można również użyć następującego polecenia z konsoli Package Manager Console.

Jak wyodrębnić AcroForm w formacie PDF za pomocą Python


Potrzebujesz Aspose.PDF dla .NET, aby wypróbować kod w swoim środowisku.

  1. Załaduj plik PDF w instancji klasy Document.
  2. Pobierz wartości ze wszystkich pól za pomocą klasy „Document.Form`.
  3. W razie potrzeby przeanalizuj nazwy i wartości.
  4. Załaduj plik PDF w instancji klasy Document
  5. Pobierz wartości ze wszystkich pól za pomocą klasy „Document.Form`

Wyodrębnij dane z formularzy PDF - Python

Ten przykładowy kod pokazuje, jak wyodrębnić dane z formularzy PDF w formacie PDF za pomocą Python

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")