使用 Python 將 DOCX 轉換為 MHTML

在您的 Python 應用程序中將 DOCX 轉換為 MHTML、HtmlFixed 和 HTML,而無需安裝 Microsoft Word®

 

對於嘗試添加 DOCX 到 MHTML(Web 存檔格式)轉換功能或 HtmlFixed 的 Python 開發人員來說,他們希望使用應用程序中的絕對定位元素將文檔保存為 HTML 格式。 Aspose.Total for Python via .NET API 可以幫助自動化轉換過程。它是處理不同格式的各種 API 的完整包。

我們使用 Aspose.Total for Python via .NET 包中的 Aspose.Words for Python via .NET API 來添加 DOCX 到 MHTML 的轉換功能。 如果 DOCX 文件很簡單,那麼它只有兩行代碼。 加載 DOCX 文件並使用適當的文件路徑以及作為 MHTML 或 HTML_FIXED 的 SaveFormat 枚舉調用 save 方法。 但是,如果需要將文檔模型恢復為接近原始模型,則需要在結果文檔中保存一些額外的信息,稱為往返信息。

如何 在 Python 中將 DOCX 轉換為 MHTML

  • 使用 Document 類加載源 DOCX 文件
  • 創建 HtmlSaveOptions 的實例。
  • 將 export_roundtrip_information 設置為 True
  • SaveFormat 指定為 MHTML
  • 在指定輸出文件路徑和 SaveFormat 作為參數時調用 save 方法。 因此,您的 DOCX 文件將在指定路徑轉換為 MHTML。

轉換要求

  • 對於 DOCX 到 MHTML 或 HtmlFixed 格式的轉換,需要 Python 3.5 或更高版本
  • 直接從 PyPI ( Aspose.Words ) 引用項目中的 API
  • 或者使用以下 pip 命令 pip install aspose.words
  • 此外,基於 Microsoft Windows 或 Linux 的操作系統(請參閱 Words 的更多信息)和 Linux 檢查 gcc 和 libpython 的附加要求,並按照 INSTALL 的分步說明進行操作。
 

在 Python 中將 DOCX 保存為 MHTML - 簡單

 
 

Python 中的 DOCX 到 MHTML 轉換

 

使用 Python 探索 DOCX 轉換選項

將 DOCX 轉換為 EMAIL (電子郵件文件)
將 DOCX 轉換為 EML (電子郵件信息)
將 DOCX 轉換為 EMLX (Apple 郵件消息)
將 DOCX 轉換為 ICS (日曆文件)
將 DOCX 轉換為 MBOX (電子郵件郵箱文件)
將 DOCX 轉換為 MSG (Outlook 郵件項目文件)
將 DOCX 轉換為 ODP (OpenDocument 演示文稿格式)
將 DOCX 轉換為 OFT (Outlook 文件模板)
將 DOCX 轉換為 OST (Outlook 離線存儲表)
將 DOCX 轉換為 POT (Microsoft PowerPoint 模板文件)
將 DOCX 轉換為 POTM (微軟 PowerPoint 模板文件)
將 DOCX 轉換為 POTX (Microsoft PowerPoint 模板演示)
將 DOCX 轉換為 PPS (PowerPoint 幻燈片放映)
將 DOCX 轉換為 PPSM (啟用宏的幻燈片放映)
將 DOCX 轉換為 PPSX (PowerPoint 幻燈片放映)
將 DOCX 轉換為 PPT (PowerPoint演示文稿)
將 DOCX 轉換為 PPTM (啟用宏的演示文稿文件)
將 DOCX 轉換為 PPTX (打開 XML 表示格式)
將 DOCX 轉換為 PST (Outlook 個人存儲表)
將 DOCX 轉換為 VCF (電子名片文件)
將 DOCX 轉換為 CSV (逗號分隔值)
將 DOCX 轉換為 DIF (數據交換格式)
將 DOCX 轉換為 EXCEL (電子表格文件格式)
將 DOCX 轉換為 FODS (OpenDocument 平面 XML 電子表格)
將 DOCX 轉換為 ODS (OpenDocument電子表格)
將 DOCX 轉換為 SXC (StarSuite Calc 電子表格)
將 DOCX 轉換為 TSV (製表符分隔值)
將 DOCX 轉換為 XLAM (Excel 啟用宏的加載項)
將 DOCX 轉換為 XLS (Microsoft Excel 二進制格式)
將 DOCX 轉換為 XLSB (Excel 二進制工作簿)
將 DOCX 轉換為 XLSM (啟用宏的電子表格)
將 DOCX 轉換為 XLSX (打開 XML 工作簿)
將 DOCX 轉換為 XLT (Excel 97 - 2003 模板)
將 DOCX 轉換為 XLTM (Excel 啟用宏的模板)

什麼是 DOCX 文件格式

DOCX 是 Microsoft 專門為其文字處理軟件 Microsoft Word 開發的一種文件格式。其目的是提供一種通用且可靠的格式,用於跨各種平台和設備創建和共享文檔。 DOCX 文件在商業、學術界和個人通信中得到廣泛採用,具有眾多優勢。

DOCX 格式的一個關鍵優勢是它與其他 Microsoft Office 應用程序(如 Excel 和 PowerPoint)無縫集成。這種集成使用戶能夠毫不費力地將表格、圖表和多媒體內容合併到他們的文檔中,從而增強他們的視覺吸引力和整體效率。此外,DOCX 文件可以方便地轉換為其他廣泛使用的格式,例如 PDF、HTML 和 RTF,確保跨不同系統的兼容性和可移植性。

DOCX 格式的靈活性擴展到它對高級格式設置選項的支持.用戶可以使用樣式、主題和模板來創建具有一致品牌和格式的具有專業外觀的文檔。這消除了對複雜技術技能的需求,使用戶能夠毫不費力地製作精美且具有視覺吸引力的內容。

DOCX 的另一個顯著優勢是它與各種軟件和設備的廣泛兼容性,包括流行的操作系統,例如Windows、macOS 和 Linux。這種兼容性確保可以跨不同環境無縫訪問、編輯和共享文檔,從而促進高效協作和溝通。

什麼是 MHTML 文件格式

MHTML 是 MIME HTML 的縮寫,是一種將 HTML 代碼及其相關資源組合到單個文件中的文件格式。它代表多用途 Internet 郵件擴展 HTML。 MHTML 文件通常用於將網頁(包括其所有內容,例如圖像、CSS 樣式表和 JavaScript)保存到單個文件中。

MHTML 文件通常是在用戶保存網頁以供離線使用時由網絡瀏覽器創建的查看或存檔目的。通過將所有必要的資源捆綁到一個文件中,MHTML 確保即使沒有互聯網連接或無法訪問原始服務器,也可以準確地查看和呈現網頁。

MHTML 格式遵循 MIME 標準,用於通過 Internet 編碼和交換各種類型的數據。它使用多部分 MIME 編碼將 HTML 代碼和相關資源打包到一個文件中。該文件通常具有 .mht 或 .mhtml 文件擴展名。

MHTML 文件可以通過支持該格式的網絡瀏覽器打開和查看,例如 Internet Explorer、Microsoft Edge 和 Opera。一些文本編輯器和專用軟件還提供打開和編輯 MHTML 文件的功能。

MHTML 格式在便攜性和便利性方面具有優勢,因為它允許用戶將網頁保存和共享為單個文件,確保頁面佈局、格式和鏈接資源的保存。然而,值得注意的是,MHTML 不像 HTML 或 PDF 等其他網絡格式那樣廣泛使用,並且兼容性可能因不同的軟件和平台而異。