Extraire des images d’un PDF via Python

Extraire des images d’un document PDF. Utilisez Aspose.PDF pour Python for .NET pour modifier les fichiers PDF par programmation

Extraire des images d'un document PDF à l'aide de la bibliothèque Python

Afin d’ajouter une image dans un PDF, nous utiliserons l’API Aspose.PDF for .NET qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages.

Python Package Manager Console

pip install aspose-pdf

Extraire l’image d’un PDF via Python


Vous avez besoin de Aspose.PDF pour la bibliothèque .NET pour essayer le code dans votre environnement.

  1. Ouvrez le document PDF.
  2. Extrayez une image particulière.
  3. Enregistrez l’image de sortie.
  4. Enregistrez le fichier PDF mis à jour.

Extraire les images d'un fichier PDF - Python

Cet exemple de code montre comment extraire des images d'un PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")