通过 Python 将 HTML 转换为 DOCX

HTML 到 DOCX Python 的转换。程序员可以使用此示例代码通过 COM Interop 在任何.NET 框架、.NET Core 和 PHP、VBScript、Delphi、C++ 中将 HTML 导出到DOCX。

在 Python for .NET 中将 HTML 转换为 DOCX

如何将 HTML 转换为 DOCX?您可以使用现代文档处理 Python API 轻松地以编程方式将文档从 HTML 转换为 DOCX 格式。仅使用几行代码即可转换高质量的文件。Aspose.PDF 库将允许任何开发者轻松解决使用 Python 将 HTML 转换为 DOCX 的任务。

有关代码片段和其他可能的转换格式的更详细描述,请参见 文档 页面。此外,您还可以查看我们的图书馆支持的其他 转换 格式。

使用 Aspose.PDF for .NET 库,你可以以编程方式将 HTML 转换为 DOCX。Aspose 的 PDF 软件非常适合个人、小型或大型企业。由于它能够处理大量信息,因此可以快速高效地进行转换并保护您的数据。Aspose.PDF 的一个特殊功能是用于将 HTML 转换为 DOCX 的 API。这种方法的特点是,你只需要打开 NuGet 包管理器,搜索 “aspose.pdf for .NET”,然后安装它,无需任何特殊的复杂设置。(使用包管理器控制台中的命令进行安装)。要验证该库的好处,请尝试使用将 HTML 转换为 DOCX 的代码片段。您也可以使用包管理器控制台中的以下命令:

Python Package Manager Console

pip install aspose-pdf

如何将 HTML 转换为 DOCX


Python for .NET 开发人员只需几行代码即可轻松加载 HTML 个文件并将其转换为 DOCX。

  1. 初始化新文档
  2. 在将输出文件路径和 SaveFormat.Docx 作为参数传递时调用 Document.Save 方法
  3. DOCX 文件将保存在指定的路径中

以下示例演示了如何在 Python 中将 HTML 转换为 DOCX。你可以按照以下简单步骤将你的 HTML 文件转换为 DOCX 格式。首先,上传你的 HTML 文件,然后将其保存为 DOCX 文件。您可以使用完全限定的文件名进行 HTML 读取和 DOCX 写入。输出 DOCX 的内容和格式将与原始 HTML 文档相同。

示例:通过 Python 将 HTML 转换为 DOCX

此示例代码显示 HTML 到 DOCX Python 的转换

Input file:

File not added

Output format:

DOCX

Output file:

    def convert_HTML_to_DOCX(self, infile, outfile):

        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        options = HtmlLoadOptions()
        document = Document(path_infile, options)

        save_option = DocSaveOptions()
        save_option.Format = DocSaveOptions.DocFormat.DocX

        # Save the file into MS Word document format

        document.Save(path_outfile, save_option)
        print(infile + " converted into " + outfile) 

使用 Python for .NET 库将 HTML 转换为 DOCX

通过.NET API 的 Python Aspose.PDF 支持大多数成熟的 PDF 标准和 PDF 规范。它允许开发人员在 PDF 文档中插入表格、图表、图像、超链接、自定义字体等。此外,也可以压缩 PDF 文档。通过.NET 的 Python Aspose.PDF 为开发安全的 PDF 文档提供了出色的安全功能。通过.NET API 为 Python 开发的 Aspose.PDF 的一些关键功能包括:

  • 能够以多种图像格式读取和导出 PDF,包括 BMP、GIF、JPEG 和 PNG。
  • 设置 PDF 文档的基本信息(例如作者、创建者)。
  • 转换功能:将 PDF 转换为 Word、Excel 和 PowerPoint。将 PDF 转换为图像格式。将 PDF 文件转换为 HTML 格式,反之亦然。将 PDF 转换为 EPUB、文本、XPS 等。

你可以在我们关于如何使用 API 的 文档 上通过.NET API 找到有关 Aspose.PDF for Python 的更多信息。