استخراج پیوست ها از PDF از طریق Python

نحوه استخراج پیوست ها از PDF به صورت برنامه نویسی با Python

چگونگی استخراج پیوست ها با استفاده از Python for .NET کتابخانه

به منظور استخراج پیوست ها در فایل پی دی اف، از API Aspose.PDF for .NET استفاده خواهیم کرد که یک API دستکاری اسناد غنی از ویژگی، قدرتمند و آسان برای استفاده برای پلتفرم python-net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Console

pip install aspose-pdf

استخراج پیوست ها از PDF Python


شما نیاز به Aspose.PDF for .NET دارید تا کد را در محیط خود امتحان کنید.

۱. دریافت مجموعه فایل های جاسازی شده. ۱. تعداد فایل های جاسازی شده را دریافت کنید. ۱. حلقه را از طریق مجموعه برای دریافت تمام پیوست ها. ۱. بررسی کنید که آیا شی پارامتر شامل پارامترها است یا خیر. ۱. پیوست را دریافت کرده و در پرونده یا استریم بنویسید.

استخراج پیوست از سند PDF

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
# Open document
document = apdf.Document(path_infile)

# Get count of the embedded files
print(f"Total files : {len(document.embedded_files)}")

# Loop through the collection to get all the attachments
for file_specification in document.embedded_files:
    print(f"Name: {file_specification.name}")
    print(f"Description: {file_specification.description}")
    print(f"Mime Type: {file_specification.mime_type}")

    # Check if parameter object contains the parameters
    if file_specification.params is not None:
        print(f"CheckSum: {file_specification.params.check_sum}")
        print(f"Creation Date: {file_specification.params.creation_date}")
        print(f"Modification Date: {file_specification.params.mod_date}")
        print(f"Size: {file_specification.params.size}")

    # Get the attachment and write to file
    with open(
        path.join(self.data_dir, "export_" + file_specification.name), "wb"
    ) as f:
        f.write(file_specification.contents.readall())