Extrahiere Bilder aus PDF über Python

Extrahieren Sie Bilder aus einem PDF-Dokument. Verwenden Sie Aspose.PDF for Python for .NET, um PDF-Dateien programmgesteuert zu ändern

Extrahieren Sie Bilder aus einem PDF-Dokument mit dem Tool Python

Um Bilder aus PDF zu extrahieren, verwenden wir die Aspose.PDF for .NET API, eine funktionsreiche, leistungsstarke und benutzerfreundliche API zur Dokumentenbearbeitung für die python-net -Plattform. Öffnen Sie den Paketmanager NuGet, suchen Sie nach Aspose.pdf und installieren Sie es. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

Console

pip install aspose-pdf

Extrahiere ein Bild aus PDF über Python


Sie benötigen Aspose.PDF for .NET-Bibliothek, um den Code in Ihrer Umgebung auszuprobieren.

  1. Öffnet das PDF-Dokument.
  2. Extrahiere ein bestimmtes Bild.
  3. Speichern Sie das Ausgabebild.
  4. Speichern Sie die aktualisierte PDF-Datei.

Extrahiere Bilder aus der PDF-Datei - Python

Dieser Beispielcode zeigt, wie Bilder aus PDF extrahiert werden - Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()