Estrai immagini dal PDF tramite Python

Estrai immagini dal documento PDF. Usa Aspose.PDF per Python for .NET per modificare i file PDF a livello di codice

Estrai immagini da un documento PDF utilizzando lo strumento Python

Per estrarre l’immagine dal PDF, utilizzeremo l’API Aspose.PDF for .NET, un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma python-net. Apri il gestore di pacchetti NuGet, cerca ASPOSE.pdf e installa. Puoi anche usare il seguente comando dalla console di Package Manager.

Console

pip install aspose-pdf

Estrai l’immagine dal PDF tramite Python


È necessario Aspose.PDF for .NET library per provare il codice nel proprio ambiente.

  1. Apri un documento PDF.
  2. Estrai un’immagine particolare.
  3. Salva l’immagine di output.
  4. Salva il file PDF aggiornato.

Estrai immagini da un file PDF - Python

Questo codice di esempio mostra come estrarre immagini da PDF - Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()