Python 経由で PDF から画像を抽出

PDF ドキュメントから画像を抽出します。プログラムで PDF ファイルを変更するには、Aspose.PDF for Python for .NET を使用してください

Python ツールを使用して PDF ドキュメントから画像を抽出します

PDF から画像を抽出するには、python-net プラットフォーム用の機能が豊富で強力で使いやすいドキュメント操作 API である Aspose.PDF for .NET API を使用します。NuGet パッケージマネージャーを開き、Aspose.pdf を検索してインストールします。パッケージマネージャーコンソールから次のコマンドを使用することもできます。

Console

pip install aspose-pdf

Python 経由で PDF から画像を抽出


ご使用の環境でコードを試すには、.NET ライブラリの場合は Aspose.PDF が必要です。

  1. PDF ドキュメントを開きます。
  2. 特定の画像を抽出します。
  3. 出力画像を保存します。
  4. 更新した PDF ファイルを保存します。

PDF ファイルから画像を抽出-Python

このサンプルコードは、PDF から画像を抽出する方法を示しています-Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()