通過 Python 將 PDF 轉換為 XML

PDF 到 XML 的 Python 转换。程序员可以使用此示例代码通过 COM Interop 将 PDF 导出到任何 .NET 框架、.NET Core 以及 PHP、VBScript、C++ 中的 XML。

如何使用 Python 將 PDF 轉換為 XML

如何將 PDF 轉換為 XML?您可以使用現代文件處理 Python API 輕鬆地以程式設計方式將文件從 PDF 轉換為 XML 格式。只需使用幾行程式碼即可轉換高品質的檔案。 Aspose.PDF 函式庫將允許任何開發人員使用 Python 輕鬆解決將 PDF 轉換為 XML 的任務。

有關程式碼片段和其他可能的轉換格式的更詳細描述,請參閱文件頁面。此外,您還可以檢查我們的庫支援的其他格式的轉換

使用 Aspose.PDF for Python via .NET 函式庫,您可以透過程式設計將 PDF 轉換為 XML。 Aspose 的 PDF 軟體非常適合個人、小型或大型企業。由於它能夠處理大量訊息,因此可以快速有效地執行轉換並保護您的資料。 Aspose.PDF 的一個獨特功能是用於將 PDF 轉換為 XML 的 API。這種方法的特點是,你只需要打開 PyPI 套件管理器,搜尋 aspose-pdf,然後安裝它,而無需任何特殊的複雜設定。為了驗證該程式庫的優勢,請嘗試使用轉換 PDF 到 XML 的程式碼片段。您也可以從控制台或終端機使用以下命令:

Console

pip install aspose-pdf

如何将 PDF 转换为 XML


Python via .NET 開發人員只需幾行代碼即可輕鬆載入並將 PDF 文件轉換為 XML。

  1. 从 aspose.pdf 库导入所需的模块,包括用于加载 PDF 文件的文档类。在继续操作之前,请确保安装和导入必要的库。
  2. 通过将 indir 与 infile 连接来指定输入 PDF 文档的路径,从而确保正确的目录结构以正确定位输入文件。
  3. 创建文档对象的实例并加载指定的输入 PDF 文件。此步骤是访问 PDF 内容以进行进一步处理所必需的。
  4. 创建 PDFXMLSaveOptions 对象的实例,该对象将用于将输出格式指定为 PDF XML 文件。此格式可用于将具有布局和格式的复杂 PDF 文件转换为更具可编辑性的格式。
  5. 使用加载的 PDF 文档和创建的 PDFXMLSaveOptions 对象将文件保存为 PDF XML 格式,这会将 PDF 内容转换为可以编辑的基于 XML 的格式。
  6. 打印一条成功消息,表明输入 PDF 已转换为 PDF XML 文件,以及输入和输出文件名以供参考。

以下示例演示了如何在 Python 中将 PDF 转换为 XML。你可以按照以下简单步骤将你的 PDF 文件转换为 XML 格式。首先,上传你的 PDF 文件,然后将其保存为 XML 文件。您可以使用完全限定的文件名进行 PDF 读取和 XML 写入。输出 XML 的内容和格式将与原始 PDF 文档相同。

示例:通過 Python 將 PDF 轉換為 XML

此示例代碼顯示 PDF 到 XML Python 的轉換

Input file:

File not added

Output format:

XML

Output file:

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
save_options = apdf.PdfXmlSaveOptions()
document.save(path_outfile, save_options)

print(infile + " converted into " + outfile)

使用 Python via .NET 将 PDF 转换为 XML

通过.NET API 的 Python Aspose.PDF 支持大多数成熟的 PDF 标准和 PDF 规范。它允许开发人员在 PDF 文档中插入表格、图表、图像、超链接、自定义字体等。此外,也可以压缩 PDF 文档。通过.NET 的 Python Aspose.PDF 为开发安全的 PDF 文档提供了出色的安全功能。通过.NET API 为 Python 开发的 Aspose.PDF 的一些关键功能包括:

  • 能够以多种图像格式读取和导出 PDF,包括 BMP、GIF、JPEG 和 PNG。
  • 设置 PDF 文档的基本信息(例如作者、创建者)。
  • 转换功能:将 PDF 转换为 Word、Excel 和 PowerPoint。将 PDF 转换为图像格式。将 PDF 文件转换为 HTML 格式,反之亦然。将 PDF 转换为 EPUB、文本、XPS 等。

你可以在我们关于如何使用 API 的 文档 上通过.NET API 找到有关 Aspose.PDF for Python 的更多信息。