Extraer imágenes del PDF a través de Python

Extrae imágenes de un documento PDF. Utilice Aspose.PDF for que Python for .NET modifique archivos PDF mediante programación

Extraiga imágenes de un documento PDF con la herramienta Python

Para extraer imágenes de un PDF, utilizaremos la API Aspose.PDF for .NET, que es una API de manipulación de documentos rica en funciones, potente y fácil de usar para la plataforma python-net. Abre el administrador de paquetes NuGet, busca Aspose.pdf e instálalo. También puede usar el siguiente comando desde la consola del administrador de paquetes.

Console

pip install aspose-pdf

Extraer imagen del PDF a través de Python


Necesita Aspose.PDF for .NET library para probar el código en su entorno.

  1. Abra el documento PDF.
  2. Extrae una imagen en particular.
  3. Guarde la imagen de salida.
  4. Guarde el archivo PDF actualizado.

Extraer imágenes de un archivo PDF - Python

Este código de ejemplo muestra cómo extraer imágenes de un PDF - Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()