通过 Python 从 PDF 中提取图像

从 PDF 文档中提取图像。使用 Aspose.PDF for Python for .NET 以编程方式修改 PDF 文件

使用 Python 工具从 PDF 文档中提取图像

为了从 PDF 中提取图像,我们将使用 Aspose.PDF for .NET API,这是一款功能丰富、强大且易于使用的文档操作 API,适用于 python-net 平台。打开 NuGet 软件包管理器,搜索 Aspose.pdf 并安装。您也可以使用包管理器控制台中的以下命令。

Console

pip install aspose-pdf

通过 Python 从 PDF 中提取图像


你需要 Aspose.PDF for .NET 库 才能在你的环境中试用代码。

  1. 打开 PDF 文档。
  2. 提取特定的图像。
  3. 保存输出图像。
  4. 保存更新后的 PDF 文件。

从 PDF 文件中提取图像-Python

此示例代码说明如何从 PDF 中提取图像-Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()