Wyodrębnij obrazy z pliku PDF za pośrednictwem Python

Wyodrębnij obrazy z dokumentu PDF. Użyj pliku Aspose.PDF dla Python for .NET, aby programowo modyfikować pliki PDF

Wyodrębnianie obrazów z dokumentu PDF za pomocą narzędzia Python

Aby wyodrębnić obraz z pliku PDF, użyjemy interfejsu API Aspose.PDF for .NET, który jest bogatym w funkcje, potężnym i łatwym w użyciu interfejsem API do manipulacji dokumentami dla platformy python-net. Otwórz menedżera pakietów NuGet, wyszukaj Aspose.pdf i zainstaluj. Można również użyć następującego polecenia z konsoli Menedżera pakietów.

Console

pip install aspose-pdf

Wyodrębnij obraz z pliku PDF za pośrednictwem Python


Potrzebujesz Aspose.PDF for .NET library, aby wypróbować kod w swoim środowisku.

  1. Otwórz dokument PDF.
  2. Wyodrębnij konkretny obraz.
  3. Zapisz obraz wyjściowy.
  4. Zapisz zaktualizowany plik PDF.

Wyodrębnij obrazy z pliku PDF - Python

Ten przykładowy kod pokazuje, jak wyodrębnić obrazy z pliku PDF - Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()