通过 Python 从 PDF 表单中提取数据

从可填写的 PDF 文档中提取用户数据字段。使用 Aspose.PDF for Python for .NET 以编程方式修改 PDF 文件

如何使用 Python for .NET 库从 PDF 表单中提取数据

为了从 PDF 文件中的 PDF 表单 (Acroforms) 中提取数据,我们将使用 Aspose.PDF for .NET API,这是适用于 python-net 平台的功能丰富、强大且易于使用的文档操作 API。你可以直接从 NuGet 包管理器下载其最新版本,搜索aspose.pdf然后安装。您也可以使用包管理器控制台中的以下命令。

如何使用 Python 在 PDF 中提取 AcroForm


您需要 [Aspose.PDF for Python]https://releases.aspose.com/pdf/net) 在您的環境中嘗試代碼。

  1. 在文件類的實例中載入 PDF。
  2. 使用「文件.表單」類從所有欄位中獲取值。
  3. 如果需要,分析名稱和值。
  4. 在文件類的實例中載入 PDF
  5. 使用「文件」類從所有欄位中獲取值

从 PDF 表单中提取数据-Python

此示例代码显示如何使用 Python 从 PDF 表单中提取数据

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")