Extrahiere Bilder aus PDF über Python

Extrahieren Sie Bilder aus einem PDF-Dokument. Verwenden Sie Aspose.PDF für Python for .NET, um PDF-Dateien programmgesteuert zu ändern

Extrahieren Sie Bilder aus einem PDF-Dokument mithilfe der Python Bibliothek

Um ein Bild in PDF hinzuzufügen, verwenden wir die API Aspose.PDF for .NET, eine funktionsreiche, leistungsstarke und einfach zu verwendende API zur Dokumentenbearbeitung für die python-net Plattform. Öffnen Sie den NuGet -Paketmanager, suchen Sie nach Aspose.pdf und installieren Sie es. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

Python Package Manager Console

pip install aspose-pdf

Extrahiere ein Bild aus PDF über Python


Sie benötigen Aspose.PDF für .NET-Bibliothek, um den Code in Ihrer Umgebung auszuprobieren.

  1. Öffnet das PDF-Dokument.
  2. Extrahiere ein bestimmtes Bild.
  3. Speichern Sie das Ausgabebild.
  4. Speichern Sie die aktualisierte PDF-Datei.

Extrahiere Bilder aus der PDF-Datei - Python

Dieser Beispielcode zeigt, wie Bilder aus PDF extrahiert werden - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")