使用 Python 将 RTF 转换为 MHTML
在您的 Python 应用程序中将 RTF 转换为 MHTML、HtmlFixed 和 HTML,而无需安装 Microsoft Word®。
对于尝试添加 RTF 到 MHTML(Web 存档格式)转换功能或 HtmlFixed 的 Python 开发人员来说,他们希望使用应用程序中的绝对定位元素将文档保存为 HTML 格式。 Aspose.Total for Python via .NET API 可以帮助自动化转换过程。它是处理不同格式的各种 API 的完整包。
我们使用 Aspose.Total for Python via .NET 包中的 Aspose.Words for Python via .NET API 来添加 RTF 到 MHTML 的转换功能。 如果 RTF 文件很简单,那么它只有两行代码。 加载 RTF 文件并使用适当的文件路径以及作为 MHTML 或 HTML_FIXED 的 SaveFormat 枚举调用 save 方法。 但是,如果需要将文档模型恢复为接近原始模型,则需要在结果文档中保存一些额外的信息,称为往返信息。
如何 在 Python 中将 RTF 转换为 MHTML
- 使用 Document 类加载源 RTF 文件
- 创建 HtmlSaveOptions 的实例。
- 将 export_roundtrip_information 设置为 True
- 将 SaveFormat 指定为 MHTML
- 在指定输出文件路径和 SaveFormat 作为参数时调用
save
方法。 因此,您的 RTF 文件将在指定路径转换为 MHTML。
转换要求
- 对于 RTF 到 MHTML 或 HtmlFixed 格式的转换,需要 Python 3.5 或更高版本
- 直接从 PyPI ( Aspose.Words ) 引用项目中的 API
- 或者使用以下 pip 命令
pip install aspose.words
。 - 此外,基于 Microsoft Windows 或 Linux 的操作系统(请参阅 Words 的更多信息)和 Linux 检查 gcc 和 libpython 的附加要求,并按照 INSTALL 的分步说明进行操作。
在 Python 中将 RTF 保存为 MHTML - 简单
import aspose.words as aw | |
doc = aw.Document(dataDir + "MicrosoftWordSimpleFile.docx") | |
doc.save(dataDir + "output.mhtml", aw.SaveFormat.MHTML) |
Python 中的 RTF 到 MHTML 转换
import aspose.words as aw | |
doc = aw.Document(dataDir + "sourcefile.docx") | |
saveOptions = aw.saving.HtmlSaveOptions() | |
saveOptions.save_format = aw.SaveFormat.MHTML | |
saveOptions.export_roundtrip_information = True | |
saveOptions.export_fonts_as_base64 = True | |
doc.save(dataDir + "wordto.mhtml", saveOptions) |