استخراج داده ها از فرم های PDF از طریق Python

فیلدهای داده کاربر را از سند PDF قابل پر کردن استخراج کنید. از Aspose.PDF برای Python for .NET استفاده کنید تا فایل های PDF را به صورت برنامه نویسی تغییر دهید

نحوه استخراج داده ها از فرم های PDF با استفاده از کتابخانه Python for .NET

به منظور استخراج داده ها از فرم های PDF (Acroforms) در یک فایل PDF، از API Aspose.PDF for .NET استفاده می کنیم که API دستکاری اسناد غنی، قدرتمند و آسان برای استفاده برای پلتفرم python-net است. شما می توانید آخرین نسخه آن را مستقیما از مدیر بسته NuGet دانلود کنید، Aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

نحوه استخراج AcroForm در PDF با استفاده از Python


شما نیاز به Aspose.PDF for .NET دارید تا کد را در محیط خود امتحان کنید.

۱. بارگذاری PDF در نمونه ای از کلاس سند. ۱. مقادیر را از تمام فیلدها با استفاده از کلاس Document.Form دریافت کنید. ۱. تجزیه و تحلیل نام و ارزش در صورت نیاز. ۱. بارگذاری PDF در نمونه ای از کلاس سند ۱. دریافت مقادیر از تمام فیلدها با استفاده از کلاس Document.Form

استخراج داده ها از فرم های پی دی اف - Python

این کد نمونه نحوه استخراج داده ها از فرم های PDF در PDF را با استفاده از Python نشان می دهد

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")