使用 Python 將 MHTML 轉換為 DOC

在您的 Python 應用程序中將 MHTML 轉換為 DOC,而無需安裝 Microsoft Word®

 

對於 Python 開發人員,誰正在嘗試在應用程序中添加 MHTML 和 HtmlFixed 到 Microsft Word DOC 轉換功能? Aspose.Total for Python via .NET API 可以幫助自動化轉換過程。 它是處理不同格式的各種 API 的完整包,包括 Microsoft Word 格式、Web 存檔 MHTML、HTML 和 HtmlFixed 格式,以使用絕對定位的元素將文檔保存為 HTML 格式。 作為 Aspose.Total for Python via .NET 包一部分的 Aspose.Words for Python via .NET API 使這種轉換很容易使用 Python 導出和導入 MHTML、PDF 和各種其他格式。

如何在 Python 中將 MHTML 轉換為 DOC

  • 使用 Document 類打開源 MHTML 文件
  • 將輸出文件路徑指定為參數時調用 save 方法。 所以你的 MHTML 文件會在指定路徑轉換為 DOC

轉換要求

  • 對於 MHTML 到 DOC 的轉換,需要 Python 3.5 或更高版本
  • 直接從 PyPI ( Aspose.Words ) 引用項目中的 API
  • 或者使用下面的 pip 命令pip install aspose.words
  • 此外,基於 Microsoft Windows 或 Linux 的操作系統(有關 Words 的更多信息)和 Linux 檢查 gcc 和 libpython 的附加要求,並按照分步說明進行操作 INSTALL
 

在 Python 中將 MHTML 保存為 DOC

 

使用 Python 探索 MHTML 轉換選項

將 MHTML 轉換為 DOCM (Microsoft Word 2007 宏文件)
將 MHTML 轉換為 DOCX (Office 2007+ Word文檔)
將 MHTML 轉換為 DOT (Microsoft Word 模板文件)
將 MHTML 轉換為 DOTM (Microsoft Word 2007+ 模板文件)
將 MHTML 轉換為 DOTX (微軟 Word 模板文件)
將 MHTML 轉換為 ODT (OpenDocument 文本文件格式)
將 MHTML 轉換為 OTT (打開文檔模板)
將 MHTML 轉換為 RTF (富文本格式)
將 MHTML 轉換為 WORDML (Microsoft Word 2003 文字處理ML)

什麼是 MHTML 文件格式

MHTML 是 MIME HTML 的縮寫,是一種將 HTML 代碼及其相關資源組合到單個文件中的文件格式。它代表多用途 Internet 郵件擴展 HTML。 MHTML 文件通常用於將網頁(包括其所有內容,例如圖像、CSS 樣式表和 JavaScript)保存到單個文件中。

MHTML 文件通常是在用戶保存網頁以供離線使用時由網絡瀏覽器創建的查看或存檔目的。通過將所有必要的資源捆綁到一個文件中,MHTML 確保即使沒有互聯網連接或無法訪問原始服務器,也可以準確地查看和呈現網頁。

MHTML 格式遵循 MIME 標準,用於通過 Internet 編碼和交換各種類型的數據。它使用多部分 MIME 編碼將 HTML 代碼和相關資源打包到一個文件中。該文件通常具有 .mht 或 .mhtml 文件擴展名。

MHTML 文件可以通過支持該格式的網絡瀏覽器打開和查看,例如 Internet Explorer、Microsoft Edge 和 Opera。一些文本編輯器和專用軟件還提供打開和編輯 MHTML 文件的功能。

MHTML 格式在便攜性和便利性方面具有優勢,因為它允許用戶將網頁保存和共享為單個文件,確保頁面佈局、格式和鏈接資源的保存。然而,值得注意的是,MHTML 不像 HTML 或 PDF 等其他網絡格式那樣廣泛使用,並且兼容性可能因不同的軟件和平台而異。

什麼是 DOC 文件格式

Microsoft Word 二進製文件格式 (DOC) 是 Microsoft Office Word 使用的專有文檔文件格式。它表示獨立於任何特定計算機體系結構或操作系統的文檔結構。 DOC 格式作為一個容器文件,利用二進制格式存儲各種類型的數據,包括格式化文本、圖像、圖表等。 DOC 格式的二進制性質使其無法被人類閱讀,但存在一些程序,例如 Microsoft Word 和 LibreOffice,可以讀取和寫入 DOC 文件。

DOC 格式最初是早在 1987 年就在 Word for Windows 2.0 中引入。此後經歷了多次修訂,最近一次迭代是 Office 2007 中引入的 Office Open XML 格式。DOC 格式的主要優勢之一在於它與 Microsoft Word 的兼容性,全球使用最廣泛的文字處理應用程序之一。這種兼容性允許用戶使用 Microsoft Word 創建和修改文檔,並方便地與也使用該應用程序的其他人共享它們。此外,許多其他文字處理應用程序具有讀取和寫入 DOC 格式的能力,使其成為文檔共享目的的多功能選擇。

DOC 格式的廣泛採用源於它與 Microsoft Word 的集成,為用戶提供了一個強大且功能豐富的環境來創建和管理文檔。該格式的靈活性超越了 Microsoft Word,使用戶能夠使用其他文字處理軟件處理 DOC 文件。這種多功能性確保了用戶之間的無縫文檔協作和互換性,無論他們選擇何種文字處理應用程序。