Extraer imágenes del PDF a través de Python

Extrae imágenes de un documento PDF. Utilice Aspose.PDF para que Python for .NET modifique archivos PDF mediante programación

Extraer imágenes de un documento PDF mediante la biblioteca Python

Para agregar una imagen en PDF, usaremos la API Aspose.PDF for .NET, que es una API de manipulación de documentos rica en funciones, potente y fácil de usar para la plataforma python-net. Abra el administrador de paquetes NuGet, busque Aspose.pdf e instálelo. También puede usar el siguiente comando desde la consola de Package Manager.

Python Package Manager Console

pip install aspose-pdf

Extraer imagen del PDF a través de Python


Necesita Aspose.PDF for .NET library para probar el código en su entorno.

  1. Abra el documento PDF.
  2. Extrae una imagen en particular.
  3. Guarde la imagen de salida.
  4. Guarde el archivo PDF actualizado.

Extraer imágenes de un archivo PDF - Python

Este código de ejemplo muestra cómo extraer imágenes de un PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")