Извлечение изображений из PDF с помощью Python

Извлеките изображения из PDF-документа. Используйте Aspose.PDF для Python for .NET для программного изменения PDF-файлов

Извлеките изображения из PDF-документа с помощью инструмента Python

Чтобы извлечь изображение из PDF, мы будем использовать API Aspose.PDF for .NET, который представляет собой многофункциональный, мощный и простой в использовании API для обработки документов для платформы python-net. Откройте диспетчер пакетов NuGet, найдите aSpose.pdf и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов.

Python Package Manager Console

pip install aspose-pdf

Извлечь изображение из PDF через Python


Вам понадобится Aspose.PDF для библиотеки.NET, чтобы попробовать код в своей среде.

  1. Откройте PDF-документ.
  2. Извлеките определенное изображение.
  3. Сохраните выходное изображение.
  4. Сохраните обновленный PDF-файл.

Извлечение изображений из PDF-файла - Python

В этом примере кода показано, как извлекать изображения из PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")