使用 Python 將 WORDML 轉換為 MHTML

在您的 Python 應用程序中將 WORDML 轉換為 MHTML、HtmlFixed 和 HTML,而無需安裝 Microsoft Word®

 

對於嘗試添加 WORDML 到 MHTML(Web 存檔格式)轉換功能或 HtmlFixed 的 Python 開發人員來說,他們希望使用應用程序中的絕對定位元素將文檔保存為 HTML 格式。 Aspose.Total for Python via .NET API 可以幫助自動化轉換過程。它是處理不同格式的各種 API 的完整包。

我們使用 Aspose.Total for Python via .NET 包中的 Aspose.Words for Python via .NET API 來添加 WORDML 到 MHTML 的轉換功能。 如果 WORDML 文件很簡單,那麼它只有兩行代碼。 加載 WORDML 文件並使用適當的文件路徑以及作為 MHTML 或 HTML_FIXED 的 SaveFormat 枚舉調用 save 方法。 但是,如果需要將文檔模型恢復為接近原始模型,則需要在結果文檔中保存一些額外的信息,稱為往返信息。

如何 在 Python 中將 WORDML 轉換為 MHTML

  • 使用 Document 類加載源 WORDML 文件
  • 創建 HtmlSaveOptions 的實例。
  • 將 export_roundtrip_information 設置為 True
  • SaveFormat 指定為 MHTML
  • 在指定輸出文件路徑和 SaveFormat 作為參數時調用 save 方法。 因此,您的 WORDML 文件將在指定路徑轉換為 MHTML。

轉換要求

  • 對於 WORDML 到 MHTML 或 HtmlFixed 格式的轉換,需要 Python 3.5 或更高版本
  • 直接從 PyPI ( Aspose.Words ) 引用項目中的 API
  • 或者使用以下 pip 命令 pip install aspose.words
  • 此外,基於 Microsoft Windows 或 Linux 的操作系統(請參閱 Words 的更多信息)和 Linux 檢查 gcc 和 libpython 的附加要求,並按照 INSTALL 的分步說明進行操作。
 

在 Python 中將 WORDML 保存為 MHTML - 簡單

 
 

Python 中的 WORDML 到 MHTML 轉換

 

使用 Python 探索 WORDML 轉換選項

將 WORDML 轉換為 EMAIL (電子郵件文件)
將 WORDML 轉換為 EML (電子郵件信息)
將 WORDML 轉換為 EMLX (Apple 郵件消息)
將 WORDML 轉換為 MBOX (電子郵件郵箱文件)
將 WORDML 轉換為 MSG (Outlook 郵件項目文件)
將 WORDML 轉換為 ODP (OpenDocument 演示文稿格式)
將 WORDML 轉換為 OFT (Outlook 文件模板)
將 WORDML 轉換為 OST (Outlook 離線存儲表)
將 WORDML 轉換為 POT (Microsoft PowerPoint 模板文件)
將 WORDML 轉換為 POTM (微軟 PowerPoint 模板文件)
將 WORDML 轉換為 POTX (Microsoft PowerPoint 模板演示)
將 WORDML 轉換為 PPS (PowerPoint 幻燈片放映)
將 WORDML 轉換為 PPSM (啟用宏的幻燈片放映)
將 WORDML 轉換為 PPSX (PowerPoint 幻燈片放映)
將 WORDML 轉換為 PPT (PowerPoint演示文稿)
將 WORDML 轉換為 PPTM (啟用宏的演示文稿文件)
將 WORDML 轉換為 PPTX (打開 XML 表示格式)
將 WORDML 轉換為 PST (Outlook 個人存儲表)
將 WORDML 轉換為 VCF (電子名片文件)
將 WORDML 轉換為 CSV (逗號分隔值)
將 WORDML 轉換為 DIF (數據交換格式)
將 WORDML 轉換為 EXCEL (電子表格文件格式)
將 WORDML 轉換為 FODS (OpenDocument 平面 XML 電子表格)
將 WORDML 轉換為 ODS (OpenDocument電子表格)
將 WORDML 轉換為 SXC (StarSuite Calc 電子表格)
將 WORDML 轉換為 TSV (製表符分隔值)
將 WORDML 轉換為 XLAM (Excel 啟用宏的加載項)
將 WORDML 轉換為 XLS (Microsoft Excel 二進制格式)
將 WORDML 轉換為 XLSB (Excel 二進制工作簿)
將 WORDML 轉換為 XLSM (啟用宏的電子表格)
將 WORDML 轉換為 XLSX (打開 XML 工作簿)
將 WORDML 轉換為 XLT (Excel 97 - 2003 模板)
將 WORDML 轉換為 XLTM (Excel 啟用宏的模板)

什麼是 WORDML 文件格式

Microsoft Word 2003 引入了一種稱為 WordprocessingML 的專有文檔格式。這種基於 XML 的格式利用自定義 XML 架構來存儲 Word 文檔的各種元素,包括文本、格式、圖像和其他內容。 WordprocessingML 旨在提供所有文檔信息的綜合表示,同時保持人類可讀和機器可讀的質量。

人類可讀意味著可以使用標准文本編輯器輕鬆訪問和編輯 WordprocessingML 文檔。這種可訪問性允許用戶在需要時直接操作底層 XML 結構。此外,WordprocessingML 旨在促進計算機系統的自動處理和轉換,從而實現向其他格式的無縫轉換或與不同軟件應用程序的集成。

WordprocessingML 是一個開放標準,這意味著其規範可公開供參考和開發者實施。這種開放性促進了眾多軟件程序的開發,包括 OpenOffice.org 和 LibreOffice 等開源解決方案,它們可以讀寫 WordprocessingML 文檔。此類工具的可用性將 WordprocessingML 文件的可訪問性和互操作性擴展到 Microsoft Word 生態系統之外。

Microsoft Word 作為全球使用最廣泛的文字處理程序之一,對 WordprocessingML 作為 XML 的普及做出了貢獻基於文字處理格式。它的廣泛接受度使 WordprocessingML 成為共享和交換格式豐富的文檔的普遍標準。

什麼是 MHTML 文件格式

MHTML 是 MIME HTML 的縮寫,是一種將 HTML 代碼及其相關資源組合到單個文件中的文件格式。它代表多用途 Internet 郵件擴展 HTML。 MHTML 文件通常用於將網頁(包括其所有內容,例如圖像、CSS 樣式表和 JavaScript)保存到單個文件中。

MHTML 文件通常是在用戶保存網頁以供離線使用時由網絡瀏覽器創建的查看或存檔目的。通過將所有必要的資源捆綁到一個文件中,MHTML 確保即使沒有互聯網連接或無法訪問原始服務器,也可以準確地查看和呈現網頁。

MHTML 格式遵循 MIME 標準,用於通過 Internet 編碼和交換各種類型的數據。它使用多部分 MIME 編碼將 HTML 代碼和相關資源打包到一個文件中。該文件通常具有 .mht 或 .mhtml 文件擴展名。

MHTML 文件可以通過支持該格式的網絡瀏覽器打開和查看,例如 Internet Explorer、Microsoft Edge 和 Opera。一些文本編輯器和專用軟件還提供打開和編輯 MHTML 文件的功能。

MHTML 格式在便攜性和便利性方面具有優勢,因為它允許用戶將網頁保存和共享為單個文件,確保頁面佈局、格式和鏈接資源的保存。然而,值得注意的是,MHTML 不像 HTML 或 PDF 等其他網絡格式那樣廣泛使用,並且兼容性可能因不同的軟件和平台而異。