Python aracılığıyla PDF’den Ekleri Çıkarın

Python ile PDF’den Ekleri Programlı Olarak Çıkarma

Python for .NET Kütüphane Kullanarak Ekleri Çıkarma

Ekleri PDF dosyasında ayıklamak için python-net platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan .NET için Aspose.PDF API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.PDF öğesini arayın ve yükleyin. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz.

Console

pip install aspose-pdf

PDF’den Ekleri Çıkarın Python


Ortamınızdaki kodu denemek için .NET için Aspose.PDF gerekir.

  1. Gömülü dosya koleksiyonunu alın.
  2. Gömülü dosyaların sayısını alın.
  3. Tüm ekleri almak için koleksiyon boyunca döngü yapın.
  4. Parametre nesnesinin parametreleri içerdiğini kontrol edin.
  5. Eki alın ve dosyaya veya akışa yazın.

PDF belgesinden eki ayıklayın

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
# Open document
document = apdf.Document(path_infile)

# Get count of the embedded files
print(f"Total files : {len(document.embedded_files)}")

# Loop through the collection to get all the attachments
for file_specification in document.embedded_files:
    print(f"Name: {file_specification.name}")
    print(f"Description: {file_specification.description}")
    print(f"Mime Type: {file_specification.mime_type}")

    # Check if parameter object contains the parameters
    if file_specification.params is not None:
        print(f"CheckSum: {file_specification.params.check_sum}")
        print(f"Creation Date: {file_specification.params.creation_date}")
        print(f"Modification Date: {file_specification.params.mod_date}")
        print(f"Size: {file_specification.params.size}")

    # Get the attachment and write to file
    with open(
        path.join(self.data_dir, "export_" + file_specification.name), "wb"
    ) as f:
        f.write(file_specification.contents.readall())