Ekstrak data dari Formulir PDF melalui Python

Ekstrak bidang data pengguna dari dokumen PDF yang dapat diisi. Gunakan Aspose.PDF untuk Python for .NET untuk memodifikasi file PDF secara terprogram

Cara Mengekstrak data dari Formulir PDF menggunakan Python for .NET Library

Untuk mengekstrak data dari Formulir PDF (Acroforms) dalam file PDF, kita akan menggunakan API Aspose.PDF for .NET, yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk platform python-net. Anda dapat mengunduh versi terbarunya langsung dari manajer paket nuget, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Cara Mengekstrak AcroForm dalam PDF menggunakan Python


Anda perlu Aspose.PDF for .NET untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dalam sebuah instance dari kelas Document.
  2. Dapatkan nilai dari semua bidang menggunakan Document.Form kelas.
  3. Analisis nama dan nilai jika diperlukan.
  4. Muat PDF dalam sebuah instance dari kelas Document
  5. Dapatkan nilai dari semua bidang menggunakan Document.Form kelas

Ekstrak data dari Formulir PDF - Python

Kode contoh ini menunjukkan cara Mengekstrak data dari Formulir PDF dalam PDF menggunakan Python

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")