Extraia imagens de PDF via Python

Extraia imagens de um documento PDF. Use o Aspose.PDF for Python for .NET para modificar arquivos PDF programaticamente

Extraia imagens de um documento PDF usando a ferramenta Python

Para extrair a imagem do PDF, usaremos a API Aspose.PDF for.NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma python-net. Abra o gerenciador de pacotes NuGet, pesquise Aspose.pdf e instale. Você também pode usar o seguinte comando no console do gerenciador de pacotes.

Console

pip install aspose-pdf

Extrair imagem do PDF via Python


Você precisa do Aspose.PDF for .NET library para testar o código em seu ambiente.

  1. Abra o documento PDF.
  2. Extraia uma imagem específica.
  3. Salve a imagem de saída.
  4. Salve o arquivo PDF atualizado.

Extraia imagens do arquivo PDF - Python

Este código de exemplo mostra como extrair imagens do PDF - Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()