Ekstrak Lampiran dari PDF melalui Python

Cara Mengekstrak Lampiran dari PDF secara terprogram dengan Python

C# Java C++ Python

Aspose.PDF
for Python for .NET

Unduh

Belajar

Beli

Cara Mengekstrak Lampiran Menggunakan Python Library

Untuk mengekstrak Lampiran dalam file PDF, kita akan menggunakan Aspose.PDF for .NET API yang merupakan API manipulasi dokumen yang kaya fitur, kuat dan mudah digunakan untuk platform python-net. Buka manajer paket nuget, cari Aspose.PDF dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Console

pip install aspose-pdf

Ekstrak Lampiran dari PDF Python

Anda perlu Aspose.PDF untuk .NET untuk mencoba kode di lingkungan Anda.

Dapatkan koleksi file tertanam.
Dapatkan hitungan file yang disematkan.
Loop melalui koleksi untuk mendapatkan semua lampiran.
Periksa apakah objek parameter berisi parameter.
Dapatkan Lampiran dan tulis ke file atau streaming.

Ekstrak Lampiran dari dokumen PDF

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
# Open document
document = apdf.Document(path_infile)

# Get count of the embedded files
print(f"Total files : {len(document.embedded_files)}")

# Loop through the collection to get all the attachments
for file_specification in document.embedded_files:
    print(f"Name: {file_specification.name}")
    print(f"Description: {file_specification.description}")
    print(f"Mime Type: {file_specification.mime_type}")

    # Check if parameter object contains the parameters
    if file_specification.params is not None:
        print(f"CheckSum: {file_specification.params.check_sum}")
        print(f"Creation Date: {file_specification.params.creation_date}")
        print(f"Modification Date: {file_specification.params.mod_date}")
        print(f"Size: {file_specification.params.size}")

    # Get the attachment and write to file
    with open(
        path.join(self.data_dir, "export_" + file_specification.name), "wb"
    ) as f:
        f.write(file_specification.contents.readall())