Wyodrębnij obrazy z pliku PDF za pośrednictwem Python

Wyodrębnij obrazy z dokumentu PDF. Użyj pliku Aspose.PDF dla Python for .NET, aby programowo modyfikować pliki PDF

Wyodrębnianie obrazów z dokumentu PDF za pomocą narzędzia Python

Aby wyodrębnić obraz z pliku PDF, użyjemy interfejsu API Aspose.PDF for .NET, który jest bogatym w funkcje, potężnym i łatwym w użyciu interfejsem API do manipulacji dokumentami dla platformy python-net. Otwórz menedżera pakietów NuGet, wyszukaj Aspose.pdf i zainstaluj. Można również użyć następującego polecenia z konsoli Menedżera pakietów.

Python Package Manager Console

pip install aspose-pdf

Wyodrębnij obraz z pliku PDF za pośrednictwem Python


Potrzebujesz Aspose.PDF for .NET library, aby wypróbować kod w swoim środowisku.

  1. Otwórz dokument PDF.
  2. Wyodrębnij konkretny obraz.
  3. Zapisz obraz wyjściowy.
  4. Zapisz zaktualizowany plik PDF.

Wyodrębnij obrazy z pliku PDF - Python

Ten przykładowy kod pokazuje, jak wyodrębnić obrazy z pliku PDF - Python

    import aspose.pdf as ap 

    input_file = DIR_INPUT + "sample_with_image.pdf"
    output_image = DIR_OUTPUT + "extract_image.jpg"
    # Open document
    document = ap.Document(input_file)

    # Extract a particular image
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Save output image
    xImage.save(outputImage)
    outputImage.close()
    # Save updated PDF file
    document.save(DIR_OUTPUT + "output.pdf")