Extraire des images d’un PDF via Python

Extraire des images d’un document PDF. Utilisez Aspose.PDF pour Python for .NET pour modifier les fichiers PDF par programmation

Extraire des images d'un document PDF à l'aide de l'outil Python

Pour extraire l’image d’un PDF, nous utiliserons l’API Aspose.PDF pour .NET qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez-le. Vous pouvez également utiliser la commande suivante depuis la console Package Manager.

Python Package Manager Console

pip install aspose-pdf

Extraire l’image d’un PDF via Python


Vous avez besoin de Aspose.PDF pour la bibliothèque .NET pour essayer le code dans votre environnement.

  1. Ouvrez le document PDF.
  2. Extrayez une image particulière.
  3. Enregistrez l’image de sortie.
  4. Enregistrez le fichier PDF mis à jour.

Extraire les images d'un fichier PDF - Python

Cet exemple de code montre comment extraire des images d'un PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")