Untuk mengekstrak Lampiran dalam file PDF, kita akan menggunakan Aspose.PDF for .NET API yang merupakan API manipulasi dokumen yang kaya fitur, kuat dan mudah digunakan untuk platform python-net. Buka manajer paket nuget, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.
Ekstrak Lampiran dari PDF Python
Anda perlu Aspose.PDF untuk .NET untuk mencoba kode di lingkungan Anda.
- Dapatkan koleksi file tertanam.
- Dapatkan hitungan file yang disematkan.
- Loop melalui koleksi untuk mendapatkan semua lampiran.
- Periksa apakah objek parameter berisi parameter.
- Dapatkan Lampiran dan tulis ke file atau streaming.
Ekstrak Lampiran dari dokumen PDF
import aspose.pdf as apdf
from os import path
path_infile = path.join(self.data_dir, infile)
# Open document
document = apdf.Document(path_infile)
# Get count of the embedded files
print(f"Total files : {len(document.embedded_files)}")
# Loop through the collection to get all the attachments
for file_specification in document.embedded_files:
print(f"Name: {file_specification.name}")
print(f"Description: {file_specification.description}")
print(f"Mime Type: {file_specification.mime_type}")
# Check if parameter object contains the parameters
if file_specification.params is not None:
print(f"CheckSum: {file_specification.params.check_sum}")
print(f"Creation Date: {file_specification.params.creation_date}")
print(f"Modification Date: {file_specification.params.mod_date}")
print(f"Size: {file_specification.params.size}")
# Get the attachment and write to file
with open(
path.join(self.data_dir, "export_" + file_specification.name), "wb"
) as f:
f.write(file_specification.contents.readall())