Extraire des images d’un PDF via Python

Extraire des images d’un document PDF. Utilisez Aspose.PDF pour Python for .NET pour modifier les fichiers PDF par programmation

Extraire des images d'un document PDF à l'aide de l'outil Python

Pour extraire l’image d’un PDF, nous utiliserons l’API Aspose.PDF pour .NET qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez-le. Vous pouvez également utiliser la commande suivante depuis la console Package Manager.

Console

pip install aspose-pdf

Extraire l’image d’un PDF via Python


Vous avez besoin de Aspose.PDF pour la bibliothèque .NET pour essayer le code dans votre environnement.

  1. Ouvrez le document PDF.
  2. Extrayez une image particulière.
  3. Enregistrez l’image de sortie.
  4. Enregistrez le fichier PDF mis à jour.

Extraire les images d'un fichier PDF - Python

Cet exemple de code montre comment extraire des images d'un PDF - Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()