通过 Python 从 PDF 中移除表格

使用 Aspose.PDF 从 PDF 文档中删除 Python for .NET 库中的表格

如何使用 Python for .NET 库从 PDF 文档中删除表格

要删除表格,请使用 Aspose.PDF for Python via .NET,这是一个功能强大且易于使用的 API。打开 PyPI,搜索 aspose-pdf 并安装。或者,运行以下命令:

Console

pip install aspose-pdf

通过 Python 从 PDF 中删除表格


你需要 Aspose.PDF for .NET 在你的环境中试用代码。

  1. 加载带有文档实例的 PDF。
  2. 创建 TableAssorber 对象来查找表格。
  3. 使用吸收剂访问第一页。
  4. 获取页面上的第一张桌子。
  5. 移除表。保存该文件。

从 PDF 中删除表格-Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
absorber = apdf.text.TableAbsorber()
absorber.visit(document.pages[1])
table = absorber.table_list[0]
absorber.remove(table)
document.save(path_outfile)