使用 Python 將 WORD 轉換為 MHTML
在您的 Python 應用程序中將 WORD 轉換為 MHTML、HtmlFixed 和 HTML,而無需安裝 Microsoft Word®。
對於嘗試添加 WORD 到 MHTML(Web 存檔格式)轉換功能或 HtmlFixed 的 Python 開發人員來說,他們希望使用應用程序中的絕對定位元素將文檔保存為 HTML 格式。 Aspose.Total for Python via .NET API 可以幫助自動化轉換過程。它是處理不同格式的各種 API 的完整包。
我們使用 Aspose.Total for Python via .NET 包中的 Aspose.Words for Python via .NET API 來添加 WORD 到 MHTML 的轉換功能。 如果 WORD 文件很簡單,那麼它只有兩行代碼。 加載 WORD 文件並使用適當的文件路徑以及作為 MHTML 或 HTML_FIXED 的 SaveFormat 枚舉調用 save 方法。 但是,如果需要將文檔模型恢復為接近原始模型,則需要在結果文檔中保存一些額外的信息,稱為往返信息。
如何 在 Python 中將 WORD 轉換為 MHTML
- 使用 Document 類加載源 WORD 文件
- 創建 HtmlSaveOptions 的實例。
- 將 export_roundtrip_information 設置為 True
- 將 SaveFormat 指定為 MHTML
- 在指定輸出文件路徑和 SaveFormat 作為參數時調用
save
方法。 因此,您的 WORD 文件將在指定路徑轉換為 MHTML。
轉換要求
- 對於 WORD 到 MHTML 或 HtmlFixed 格式的轉換,需要 Python 3.5 或更高版本
- 直接從 PyPI ( Aspose.Words ) 引用項目中的 API
- 或者使用以下 pip 命令
pip install aspose.words
。 - 此外,基於 Microsoft Windows 或 Linux 的操作系統(請參閱 Words 的更多信息)和 Linux 檢查 gcc 和 libpython 的附加要求,並按照 INSTALL 的分步說明進行操作。
在 Python 中將 WORD 保存為 MHTML - 簡單
Python 中的 WORD 到 MHTML 轉換
使用 Python 探索 WORD 轉換選項
什麼是 WORD 文件格式
Microsoft Word 是一種廣泛使用的文字處理軟件,它提供了一系列用於保存和共享文檔的文件格式。默認格式是 DOC,這種格式在早期版本的 Word 中已經流行。然而,更新和更高效的格式 DOCX 因其更小的文件大小和增強的數據恢復能力而成為默認選擇。 PDF 是另一種常用格式,它保留格式和佈局,同時在任何設備上都易於查看。
為了與不同的軟件應用程序兼容,RTF 格式用作可以輕鬆交換的純文本格式。另一方面,HTML 專門用於創建網頁。 ODT 是一種開源格式,可確保與各種軟件應用程序的兼容性,而 TXT 是一種僅包含文本本身的簡單純文本格式。
選擇合適的格式取決於幾個因素,包括預期的應用程序、兼容性與其他軟件,以及文檔的大小和復雜性。通過熟悉可用的格式,用戶可以優化他們的工作流程,並就最適合其特定文檔的格式做出明智的決定。
什麼是 MHTML 文件格式
MHTML 是 MIME HTML 的縮寫,是一種將 HTML 代碼及其相關資源組合到單個文件中的文件格式。它代表多用途 Internet 郵件擴展 HTML。 MHTML 文件通常用於將網頁(包括其所有內容,例如圖像、CSS 樣式表和 JavaScript)保存到單個文件中。
MHTML 文件通常是在用戶保存網頁以供離線使用時由網絡瀏覽器創建的查看或存檔目的。通過將所有必要的資源捆綁到一個文件中,MHTML 確保即使沒有互聯網連接或無法訪問原始服務器,也可以準確地查看和呈現網頁。
MHTML 格式遵循 MIME 標準,用於通過 Internet 編碼和交換各種類型的數據。它使用多部分 MIME 編碼將 HTML 代碼和相關資源打包到一個文件中。該文件通常具有 .mht 或 .mhtml 文件擴展名。
MHTML 文件可以通過支持該格式的網絡瀏覽器打開和查看,例如 Internet Explorer、Microsoft Edge 和 Opera。一些文本編輯器和專用軟件還提供打開和編輯 MHTML 文件的功能。
MHTML 格式在便攜性和便利性方面具有優勢,因為它允許用戶將網頁保存和共享為單個文件,確保頁面佈局、格式和鏈接資源的保存。然而,值得注意的是,MHTML 不像 HTML 或 PDF 等其他網絡格式那樣廣泛使用,並且兼容性可能因不同的軟件和平台而異。