使用 Python 将 DOCX 转换为 MHTML

在您的 Python 应用程序中将 DOCX 转换为 MHTML、HtmlFixed 和 HTML,而无需安装 Microsoft Word®

 

对于尝试添加 DOCX 到 MHTML(Web 存档格式)转换功能或 HtmlFixed 的 Python 开发人员来说,他们希望使用应用程序中的绝对定位元素将文档保存为 HTML 格式。 Aspose.Total for Python via .NET API 可以帮助自动化转换过程。它是处理不同格式的各种 API 的完整包。

我们使用 Aspose.Total for Python via .NET 包中的 Aspose.Words for Python via .NET API 来添加 DOCX 到 MHTML 的转换功能。 如果 DOCX 文件很简单,那么它只有两行代码。 加载 DOCX 文件并使用适当的文件路径以及作为 MHTML 或 HTML_FIXED 的 SaveFormat 枚举调用 save 方法。 但是,如果需要将文档模型恢复为接近原始模型,则需要在结果文档中保存一些额外的信息,称为往返信息。

如何 在 Python 中将 DOCX 转换为 MHTML

  • 使用 Document 类加载源 DOCX 文件
  • 创建 HtmlSaveOptions 的实例。
  • 将 export_roundtrip_information 设置为 True
  • SaveFormat 指定为 MHTML
  • 在指定输出文件路径和 SaveFormat 作为参数时调用 save 方法。 因此,您的 DOCX 文件将在指定路径转换为 MHTML。

转换要求

  • 对于 DOCX 到 MHTML 或 HtmlFixed 格式的转换,需要 Python 3.5 或更高版本
  • 直接从 PyPI ( Aspose.Words ) 引用项目中的 API
  • 或者使用以下 pip 命令 pip install aspose.words
  • 此外,基于 Microsoft Windows 或 Linux 的操作系统(请参阅 Words 的更多信息)和 Linux 检查 gcc 和 libpython 的附加要求,并按照 INSTALL 的分步说明进行操作。
 

在 Python 中将 DOCX 保存为 MHTML - 简单

 
 

Python 中的 DOCX 到 MHTML 转换

 

探索 DOCX Python 的转换选项

将DOCX转换为CSV (逗号分隔值)
将DOCX转换为DIF (数据交换格式)
将DOCX转换为EXCEL (电子表格文件格式)
将DOCX转换为FODS (OpenDocument 平面 XML 电子表格)
将DOCX转换为ODS (OpenDocument电子表格)
将DOCX转换为SXC (StarSuite Calc 电子表格)
将DOCX转换为TSV (制表符分隔值)
将DOCX转换为XLAM (Excel 启用宏的加载项)
将DOCX转换为XLS (Microsoft Excel 二进制格式)
将DOCX转换为XLSB (Excel 二进制工作簿)
将DOCX转换为XLSM (启用宏的电子表格)
将DOCX转换为XLSX (打开 XML 工作簿)
将DOCX转换为XLT (Excel 97 - 2003 模板)
将DOCX转换为XLTM (Excel 启用宏的模板)
将DOCX转换为XLTX (Excel模板)
将DOCX转换为EMAIL (电子邮件文件)
将DOCX转换为EML (电子邮件信息)
将DOCX转换为EMLX (Apple 邮件消息)
将DOCX转换为ICS (日历文件)
将DOCX转换为MBOX (电子邮件邮箱文件)
将DOCX转换为MSG (Outlook 邮件项目文件)
将DOCX转换为ODP (OpenDocument 演示文稿格式)
将DOCX转换为OFT (Outlook 文件模板)
将DOCX转换为OST (Outlook 离线存储表)
将DOCX转换为POT (Microsoft PowerPoint 模板文件)
将DOCX转换为POTM (Microsoft PowerPoint 模板文件)
将DOCX转换为POTX (Microsoft PowerPoint 模板演示)
将DOCX转换为PPS (PowerPoint 幻灯片放映)
将DOCX转换为PPSM (启用宏的幻灯片放映)
将DOCX转换为PPSX (PowerPoint 幻灯片放映)
将DOCX转换为PPT (PowerPoint演示文稿)
将DOCX转换为PPTM (启用宏的演示文稿文件)
将DOCX转换为PPTX (打开 XML 表示格式)
将DOCX转换为PST (Outlook 个人存储表)
将DOCX转换为VCF (电子名片档案)