Извлечение изображений из PDF с помощью Python

Извлеките изображения из PDF-документа. Используйте Aspose.PDF для Python for .NET для программного изменения PDF-файлов

Извлеките изображения из PDF-документа с помощью инструмента Python

Чтобы извлечь изображение из PDF, мы будем использовать API Aspose.PDF for .NET, который представляет собой многофункциональный, мощный и простой в использовании API для обработки документов для платформы python-net. Откройте диспетчер пакетов NuGet, найдите aSpose.pdf и установите. Вы также можете использовать следующую команду в консоли диспетчера пакетов.

Console

pip install aspose-pdf

Извлечь изображение из PDF с помощью Python


Вам понадобится Aspose.PDF для библиотеки.NET, чтобы попробовать код в своей среде.

  1. Откройте PDF-документ.
  2. Извлеките определенное изображение.
  3. Сохраните выходное изображение.
  4. Сохраните обновленный PDF-файл.

Извлечение изображений из PDF-файла - Python

В этом примере кода показано, как извлекать изображения из PDF - Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()