Ekstrak data dari Formulir PDF melalui Python

Ekstrak bidang data pengguna dari dokumen PDF yang dapat diisi. Gunakan Aspose.PDF untuk Python for .NET untuk memodifikasi file PDF secara terprogram

Cara Mengekstrak data dari Formulir PDF menggunakan perpustakaan Python

Untuk mengekstrak Formulir PDF (Acroforms) dalam file PDF, kita akan menggunakan Aspose.PDF untuk Python melalui .NET API, yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk aplikasi Python. Anda dapat mengunduh versi terbarunya langsung dari manajer paket PyPI, cari aspose-pdf dan instal. Anda juga dapat menggunakan perintah berikut dari konsol atau terminal.

Cara Mengekstrak AcroForm dalam PDF menggunakan Python


Anda memerlukan Aspose.PDF untuk.NET untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dalam contoh kelas Dokumen.
  2. Dapatkan nilai dari semua bidang menggunakan kelas Document.Form.
  3. Analisis nama dan nilai jika diperlukan.
  4. Memuat PDF dalam contoh kelas Dokumen
  5. Dapatkan nilai dari semua bidang menggunakan kelas Document.Form

Ekstrak data dari Formulir PDF - Python

Kode sampel ini menunjukkan cara Mengekstrak data dari Formulir PDF dalam PDF menggunakan Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)