به منظور استخراج پیوست ها در فایل پی دی اف، از API Aspose.PDF for .NET استفاده خواهیم کرد که یک API دستکاری اسناد غنی از ویژگی، قدرتمند و آسان برای استفاده برای پلتفرم python-net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.
استخراج پیوست ها از PDF Python
شما نیاز به Aspose.PDF for .NET دارید تا کد را در محیط خود امتحان کنید.
۱. دریافت مجموعه فایل های جاسازی شده.
۱. تعداد فایل های جاسازی شده را دریافت کنید.
۱. حلقه را از طریق مجموعه برای دریافت تمام پیوست ها.
۱. بررسی کنید که آیا شی پارامتر شامل پارامترها است یا خیر.
۱. پیوست را دریافت کرده و در پرونده یا استریم بنویسید.
استخراج پیوست از سند PDF
def attachment_extract(self, infile):
path_infile = self.dataDir + infile
# Open document
pdfDocument = Document(path_infile)
# Get embedded files collection
embeddedFiles = pdfDocument.EmbeddedFiles
# Get count of the embedded files
print ( "Total files : %d " % (embeddedFiles.Count))
count = 1
# Loop through the collection to get all the attachments
for fileSpecification in embeddedFiles:
print("Name: " + fileSpecification.Name)
print("Description: " + fileSpecification.Description)
print("Mime Type: " + fileSpecification.MIMEType)
# Check if parameter object contains the parameters
if (fileSpecification.Params != None):
print("CheckSum: " + fileSpecification.Params.CheckSum)
print("Creation Date: " + fileSpecification.Params.CreationDate)
print("Modification Date " + fileSpecification.Params.ModDate)
print("Size: " + fileSpecification.Params.Size)
# Get the attachment and write to file or stream
File.WriteAllBytes(self.dataDir + count + "_out" + ".txt", fileSpecification.Contents)
count+=1