استخراج داده ها از فرم های PDF از طریق Python

فیلدهای داده کاربر را از سند PDF قابل پر کردن استخراج کنید. از Aspose.PDF برای Python for .NET استفاده کنید تا فایل های PDF را به صورت برنامه نویسی تغییر دهید

C# Java C++ Python

نحوه استخراج داده ها از فرم های PDF با استفاده از کتابخانه Python

به منظور استخراج فرم های PDF (Acroforms) در یک فایل PDF، از Aspose.PDF برای Python از طریق .NET API استفاده خواهیم کرد، که دارای ویژگی های غنی، قدرتمند و آسان برای دستکاری اسناد برای برنامه پایتون است. می توانید آخرین نسخه آن را مستقیماً از مدیر بسته PyPI بارگیری کنید، aspose-pdf را جستجو کرده و نصب کنید. همچنین می توانید از دستور زیر از کنسول یا ترمینال استفاده کنید.

نحوه استخراج AcroForm در PDF با استفاده از Python

شما به Aspose.PDF for .NET نیاز دارید تا کد را در محیط خود امتحان کنید.

۱. PDF را در یک نمونه از کلاس Document بارگذاری کنید. ۱. مقادیر را از تمام فیلدها با استفاده از کلاس Document.Form دریافت کنید. ۱. در صورت لزوم نام ها و مقادیر را تجزیه و تحلیل کنید. ۱. PDF را در یک نمونه از کلاس Document بارگذاری کنید ۱. دریافت مقادیر از تمام فیلدها با استفاده از کلاس Document.Form

استخراج داده ها از فرم های PDF - Python

این کد نمونه نحوه استخراج داده ها از فرم های PDF در PDF با استفاده از Python نشان می دهد

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)