通过 Python 从 PDF 表单中提取数据

通过 Python 从可填写的 PDF 文档中提取用户数据字段。使用服务器端 API 构建您自己的 Python for .NET 应用程序。

如何使用 Python for .NET 库从 PDF 表单中提取数据

为了从 PDF 文件中的 PDF 表单 (Acroforms) 中提取数据,我们将使用 Aspose.PDF for .NET API,这是适用于 python-net 平台的功能丰富、强大且易于使用的文档操作 API。你可以直接从 NuGet 包管理器下载其最新版本,搜索aspose.pdf然后安装。您也可以使用包管理器控制台中的以下命令。

如何使用 Python 提取 PDF 中的 AcroForm


你需要 Aspose.PDF for .NET 在你的环境中试用代码。

1.在 “文档” 类的实例中加载 PDF。 1.使用 Document.Form 类从所有字段中获取值。 1.如果需要,可以分析名称和值。 1.在文档类的实例中加载 PDF 1.使用 Document.Form 类从所有字段中获取值

从 PDF 表单中提取数据-Python

此示例代码显示如何使用 Python 从 PDF 表单中提取数据

    // Open document
    Document pdfDocument = new Document(dataDir + "GetValuesFromAllFields.pdf");

    // Get values from all fields
    foreach (Field formField in pdfDocument.Form)
    {
        // Analyze names and values if need
        Console.WriteLine("Field Name : {0} ", formField.PartialName);
        Console.WriteLine("Value : {0} ", formField.Value);
    }