Extrahiere Bilder aus PDF über Python

Extrahieren Sie Bilder aus einem PDF-Dokument. Verwenden Sie Aspose.PDF für Python for .NET, um PDF-Dateien programmgesteuert zu ändern

Extrahieren Sie Bilder aus einem PDF-Dokument mit dem Tool Python

Um Bilder aus PDF zu extrahieren, verwenden wir die Aspose.PDF for .NET API, eine funktionsreiche, leistungsstarke und benutzerfreundliche API zur Dokumentenbearbeitung für die python-net -Plattform. Öffnen Sie den Paketmanager NuGet, suchen Sie nach Aspose.pdf und installieren Sie es. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

Python Package Manager Console

pip install aspose-pdf

Extrahiere ein Bild aus PDF über Python


Sie benötigen Aspose.PDF für .NET-Bibliothek, um den Code in Ihrer Umgebung auszuprobieren.

  1. Öffnet das PDF-Dokument.
  2. Extrahiere ein bestimmtes Bild.
  3. Speichern Sie das Ausgabebild.
  4. Speichern Sie die aktualisierte PDF-Datei.

Extrahiere Bilder aus der PDF-Datei - Python

Dieser Beispielcode zeigt, wie Bilder aus PDF extrahiert werden - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")