استخراج پیوست ها از PDF از طریق Python

نحوه استخراج پیوست ها از PDF به صورت برنامه نویسی با Python

چگونگی استخراج پیوست ها با استفاده از Python for .NET کتابخانه

به منظور استخراج پیوست ها در فایل پی دی اف، از API Aspose.PDF for .NET استفاده خواهیم کرد که یک API دستکاری اسناد غنی از ویژگی، قدرتمند و آسان برای استفاده برای پلتفرم python-net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Python Package Manager Console

pip install aspose-pdf

استخراج پیوست ها از PDF Python


شما نیاز به Aspose.PDF for .NET دارید تا کد را در محیط خود امتحان کنید.

۱. دریافت مجموعه فایل های جاسازی شده. ۱. تعداد فایل های جاسازی شده را دریافت کنید. ۱. حلقه را از طریق مجموعه برای دریافت تمام پیوست ها. ۱. بررسی کنید که آیا شی پارامتر شامل پارامترها است یا خیر. ۱. پیوست را دریافت کرده و در پرونده یا استریم بنویسید.

استخراج پیوست از سند PDF

 def attachment_extract(self, infile):

        path_infile = self.dataDir + infile

        # Open document
        pdfDocument = Document(path_infile)

        # Get embedded files collection
        embeddedFiles = pdfDocument.EmbeddedFiles

        # Get count of the embedded files
        print ( "Total files : %d " % (embeddedFiles.Count))

        count = 1

        # Loop through the collection to get all the attachments

        for fileSpecification in embeddedFiles:
            print("Name: " + fileSpecification.Name)
            print("Description: " + fileSpecification.Description)
            print("Mime Type: " + fileSpecification.MIMEType)

            # Check if parameter object contains the parameters
            if (fileSpecification.Params != None):
                print("CheckSum: " + fileSpecification.Params.CheckSum)
                print("Creation Date: " + fileSpecification.Params.CreationDate)
                print("Modification Date " + fileSpecification.Params.ModDate)
                print("Size: " + fileSpecification.Params.Size)

                # Get the attachment and write to file or stream
                File.WriteAllBytes(self.dataDir + count + "_out" + ".txt", fileSpecification.Contents)

                count+=1