แยกข้อมูลจากแบบฟอร์ม PDF ผ่าน Python

แยกฟิลด์ข้อมูลผู้ใช้จากเอกสาร PDF ที่กรอกได้ใช้ Aspose.PDF สำหรับ Python for .NET เพื่อแก้ไขไฟล์ PDF แบบโปรแกรม

วิธีแยกข้อมูลจากแบบฟอร์ม PDF โดยใช้ไลบรารี Python

ในการแยกฟอร์ม PDF (Acroforms) ในไฟล์ PDF เราจะใช้ Aspose.PDF for Python ผ่าน.NET API ซึ่งเป็น API การจัดการเอกสารที่อุดมไปด้วยคุณสมบัติ ทรงพลัง และใช้งานง่าย สำหรับแอป Pythonคุณสามารถดาวน์โหลดเวอร์ชันล่าสุดได้โดยตรงจาก PyPi ตัวจัดการแพ็คเกจ ค้นหาaspose-pdf และติดตั้งคุณอาจใช้คำสั่งต่อไปนี้จากคอนโซลหรือเทอร์มินัล

วิธีแยก AcroForm ใน PDF โดยใช้ Python


คุณต้อง Aspose.PDF for .NET เพื่อลองใช้รหัสในสภาพแวดล้อมของคุณ

1.โหลด PDF ในอินสแตนซ์ของคลาสเอกสาร 1.รับค่าจากทุกฟิลด์โดยใช้คลาส Document.Form 1.วิเคราะห์ชื่อและค่าหากจำเป็น 1.โหลด PDF ในอินสแตนซ์ของคลาสเอกสาร 1.รับค่าจากทุกฟิลด์โดยใช้คลาส Document.Form

แยกข้อมูลจากแบบฟอร์ม PDF - Python

รหัสตัวอย่างนี้แสดงวิธีการแยกข้อมูลจากแบบฟอร์ม PDF ใน PDF โดยใช้ Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)