Ekleri PDF dosyasında ayıklamak için python-net platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan .NET için Aspose.PDF API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.PDF öğesini arayın ve yükleyin. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz.
PDF’den Ekleri Çıkarın Python
Ortamınızdaki kodu denemek için .NET için Aspose.PDF gerekir.
- Gömülü dosya koleksiyonunu alın.
- Gömülü dosyaların sayısını alın.
- Tüm ekleri almak için koleksiyon boyunca döngü yapın.
- Parametre nesnesinin parametreleri içerdiğini kontrol edin.
- Eki alın ve dosyaya veya akışa yazın.
PDF belgesinden eki ayıklayın
import aspose.pdf as apdf
from os import path
path_infile = path.join(self.data_dir, infile)
# Open document
document = apdf.Document(path_infile)
# Get count of the embedded files
print(f"Total files : {len(document.embedded_files)}")
# Loop through the collection to get all the attachments
for file_specification in document.embedded_files:
print(f"Name: {file_specification.name}")
print(f"Description: {file_specification.description}")
print(f"Mime Type: {file_specification.mime_type}")
# Check if parameter object contains the parameters
if file_specification.params is not None:
print(f"CheckSum: {file_specification.params.check_sum}")
print(f"Creation Date: {file_specification.params.creation_date}")
print(f"Modification Date: {file_specification.params.mod_date}")
print(f"Size: {file_specification.params.size}")
# Get the attachment and write to file
with open(
path.join(self.data_dir, "export_" + file_specification.name), "wb"
) as f:
f.write(file_specification.contents.readall())