对于 Python 开发人员,谁正在尝试在应用程序中添加 MHTML 和 HtmlFixed 到 Microsft Word WORDML 转换功能? Aspose.Total for Python via .NET API 可以帮助自动化转换过程。 它是处理不同格式的各种 API 的完整包,包括 Microsoft Word 格式、Web 存档 MHTML、HTML 和 HtmlFixed 格式,以使用绝对定位的元素将文档保存为 HTML 格式。 作为 Aspose.Total for Python via .NET 包一部分的 Aspose.Words for Python via .NET API 使这种转换很容易使用 Python 导出和导入 MHTML、PDF 和各种其他格式。
如何在 Python 中将 MHTML 转换为 WORDML
- 使用 Document 类打开源 MHTML 文件
- 将输出文件路径指定为参数时调用
save方法。 所以你的 MHTML 文件会在指定路径转换为 WORDML
转换要求
- 对于 MHTML 到 WORDML 的转换,需要 Python 3.5 或更高版本
- 直接从 PyPI ( Aspose.Words ) 引用项目中的 API
- 或者使用下面的 pip 命令
pip install aspose.words - 此外,基于 Microsoft Windows 或 Linux 的操作系统(有关 Words 的更多信息)和 Linux 检查 gcc 和 libpython 的附加要求,并按照分步说明进行操作 INSTALL
在 Python 中将 MHTML 保存为 WORDML
MHTML 到 WordML 的 Python 转换将归档的网页内容转换为基于 XML 的 Word 文档标记,以实现结构化文档处理和系统级处理。当文档内容必须集成到支持 XML 的工作流或使用编程工具进一步转换时,这尤其有价值。
在高度自动化的环境中,WordML 支持可扩展的处理、结构化交换以及在基于规则的系统中更容易操作文档内容。它有助于将来源于网页的信息与机器可读的文档工作流衔接。
关键用例
基于 XML 的文档转换
将 MHTML 文件转换为 WordML,以供依赖结构化和机器可读文档格式的系统使用。系统集成工作流
当转换后的内容需要在支持 XML 的平台和服务之间传递时,使用 WordML 输出。编程式文档处理
在代码驱动的环境中,实现对转换文档的更容易的解析、验证和转换。结构化归档转换
以适合受控且可扩展的文档操作的格式保存归档的网页内容。
自动化场景
XML 文档管道
自动将 MHTML 转换为 WordML,以便在结构化内容和转换系统中进行处理。基于规则的内容处理
使用 Python API 生成可通过自动化规则进行验证或修改的 WordML 文件。数据交换自动化
将转换后的文档集成到需要 XML 友好格式以实现互操作性的工作流中。机器可读的归档处理
将捕获的网页转化为支持可扩展解析和下游自动化的结构化输出。
探索 MHTML Python 的转换选项
将MHTML转换为DOC
(Microsoft Word 二进制格式)
将MHTML转换为DOCM
(Microsoft Word 2007 宏文件)
将MHTML转换为DOCX
(Office 2007+ Word文档)
将MHTML转换为DOT
(Microsoft Word 模板文件)
将MHTML转换为DOTM
(Microsoft Word 2007+ 模板文件)
将MHTML转换为DOTX
(微软 Word 模板文件)
将MHTML转换为ODT
(OpenDocument 文本文件格式)
将MHTML转换为OTT
(打开文档模板)
将MHTML转换为RTF
(富文本格式)