Извлечение изображений из PDF с помощью Python

Извлеките изображения из PDF-документа. Используйте Aspose.PDF для Python for .NET для программного изменения PDF-файлов

Извлечение изображений из PDF-документа с помощью библиотеки Python

Чтобы добавить изображение в PDF, мы будем использовать Aspose.PDF для.NET API, который представляет собой многофункциональный, мощный и простой в использовании API для работы с документами для платформы python-net. Откройте менеджер пакетов NuGet, найдите Aspose.pdf и установите. Вы также можете использовать следующую команду из консоли Package Manager.

Python Package Manager Console

pip install aspose-pdf

Извлечь изображение из PDF через Python


Вам понадобится Aspose.PDF для библиотеки.NET, чтобы попробовать код в своей среде.

  1. Откройте PDF-документ.
  2. Извлеките определенное изображение.
  3. Сохраните выходное изображение.
  4. Сохраните обновленный PDF-файл.

Извлечение изображений из PDF-файла - Python

В этом примере кода показано, как извлекать изображения из PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")