通过 Python 从 PDF 中提取图像

从 PDF 文档中提取图像。使用 Aspose.PDF for Python for .NET 以编程方式修改 PDF 文件

C# Java C++ Python

Aspose.PDF
for Python for .NET

下载

学习

买

使用 Python 工具从 PDF 文档中提取图像

为了从 PDF 中提取图像，我们将使用 Aspose.PDF for .NET API，这是一款功能丰富、强大且易于使用的文档操作 API，适用于 python-net 平台。打开 NuGet 软件包管理器，搜索 Aspose.PDF 并安装。您也可以使用包管理器控制台中的以下命令。

Console

pip install aspose-pdf

通过 Python 从 PDF 中提取图像

你需要 Aspose.PDF for .NET 库才能在你的环境中试用代码。

打开 PDF 文档。
提取特定的图像。
保存输出图像。
保存更新后的 PDF 文件。

从 PDF 文件中提取图像-Python

此示例代码说明如何从 PDF 中提取图像-Python

import aspose.pdf as apdf

from os import path
from io import FileIO

input_file = path.join(self.data_dir, infile)
output_image = path.join(self.data_dir, outfile)

document = apdf.Document(input_file)

# Extract a particular image
xImage = document.pages[2].resources.images[1]
output_image = FileIO(output_image, "w")

# Save output image
xImage.save(output_image)
output_image.close()