Estrai immagini dal PDF tramite Python

Estrai immagini dal documento PDF. Usa Aspose.PDF per Python for .NET per modificare i file PDF a livello di codice

Estrai immagini da un documento PDF utilizzando la libreria Python

Per aggiungere un’immagine in PDF, useremo l’API Aspose.PDF for .NET che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma python-net. Apri il gestore di pacchetti NuGet, cerca Aspose.pdf e installa. È inoltre possibile utilizzare il seguente comando dalla console di Package Manager.

Python Package Manager Console

pip install aspose-pdf

Estrai l’immagine dal PDF tramite Python


È necessario Aspose.PDF for .NET library per provare il codice nel proprio ambiente.

  1. Apri un documento PDF.
  2. Estrai un’immagine particolare.
  3. Salva l’immagine di output.
  4. Salva il file PDF aggiornato.

Estrai immagini da un file PDF - Python

Questo codice di esempio mostra come estrarre immagini da PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")