Extraia imagens de PDF via Python

Extraia imagens de um documento PDF. Use o Aspose.PDF para Python for .NET para modificar arquivos PDF programaticamente

Extraia imagens de um documento PDF usando a biblioteca Python

Para adicionar imagem em PDF, usaremos a API Aspose.PDF for .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma python-net. Abra o gerenciador de pacotes NuGet, procure por Aspose.pdf e instale. Você também pode usar o seguinte comando no Console do Gerenciador de Pacotes.

Python Package Manager Console

pip install aspose-pdf

Extrair imagem do PDF via Python


Você precisa do Aspose.PDF for .NET library para testar o código em seu ambiente.

  1. Abra o documento PDF.
  2. Extraia uma imagem específica.
  3. Salve a imagem de saída.
  4. Salve o arquivo PDF atualizado.

Extraia imagens do arquivo PDF - Python

Este código de exemplo mostra como extrair imagens do PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")