使用 Python 將 DOC 轉換為 PST

在您的 Python 應用程序中將 DOC 轉換為 PST,而無需安裝 Microsoft Word® 或 Outlook。

 

對於 Python 開發人員,誰正在嘗試在應用程序中添加 DOC 到 PST 轉換功能? Aspose.Total for Python via .NET API 可以幫助自動化轉換過程。 它是處理不同格式的各種 API 的完整包,包括電子郵件、圖像和 Microsoft Word 格式。 作為 Aspose.Total for Python via .NET 包的一部分的 Aspose.Words for Python via .NETAspose.Email for Python via .NET API 使用 Python 可以輕鬆進行此轉換。 這是一個兩步過程,首先加載 DOC 文件並通過 Aspose.Words for Python via .NET 將其呈現為 HTML。 其次使用 Aspose.Email for Python via .NET 加載轉換後的 HTML 並將其保存為 PST 格式。

如何在 Python 中將 DOC 轉換為 PST

  • 使用 Document 類打開源 DOC 文件
  • 在指定輸出 HTML 文件路徑和相關的 HTML 保存選項作為參數時調用 save 方法。 所以你的 DOC 文件在指定的路徑被轉換成 HTML
  • 現在使用 MailMessage.load 加載保存的 HTML 文件
  • 使用相關文件路徑調用 save 方法。所以最後DOC被轉換了

轉換要求

  • 對於 DOC 到 PST 的轉換,需要 Python 3.5 或更高版本
  • 直接從 PyPI 引用項目中的 API( Aspose.WordsAspose.Email
  • 或者使用以下 pip 命令 pip install aspose.wordspip install Aspose.Email-for-Python-via-NET
  • 此外,基於 Microsoft Windows 或 Linux 的操作系統(有關 WordsEmail 的更多信息)和 Linux 檢查 gcc 和 libpython 的附加要求,並按照分步說明進行操作 INSTALL
 

在 Python 中將 DOC 保存為 PST

 

使用 Python 探索 DOC 轉換選項

將 DOC 轉換為 EMAIL (電子郵件文件)
將 DOC 轉換為 EML (電子郵件信息)
將 DOC 轉換為 EMLX (Apple 郵件消息)
將 DOC 轉換為 ICS (日曆文件)
將 DOC 轉換為 MBOX (電子郵件郵箱文件)
將 DOC 轉換為 MSG (Outlook 郵件項目文件)
將 DOC 轉換為 ODP (OpenDocument 演示文稿格式)
將 DOC 轉換為 OFT (Outlook 文件模板)
將 DOC 轉換為 OST (Outlook 離線存儲表)
將 DOC 轉換為 POT (Microsoft PowerPoint 模板文件)
將 DOC 轉換為 POTM (微軟 PowerPoint 模板文件)
將 DOC 轉換為 POTX (Microsoft PowerPoint 模板演示)
將 DOC 轉換為 PPS (PowerPoint 幻燈片放映)
將 DOC 轉換為 PPSM (啟用宏的幻燈片放映)
將 DOC 轉換為 PPSX (PowerPoint 幻燈片放映)
將 DOC 轉換為 PPT (PowerPoint演示文稿)
將 DOC 轉換為 PPTM (啟用宏的演示文稿文件)
將 DOC 轉換為 PPTX (打開 XML 表示格式)
將 DOC 轉換為 VCF (電子名片文件)
將 DOC 轉換為 CSV (逗號分隔值)
將 DOC 轉換為 DIF (數據交換格式)
將 DOC 轉換為 EXCEL (電子表格文件格式)
將 DOC 轉換為 FODS (OpenDocument 平面 XML 電子表格)
將 DOC 轉換為 ODS (OpenDocument電子表格)
將 DOC 轉換為 SXC (StarSuite Calc 電子表格)
將 DOC 轉換為 TSV (製表符分隔值)
將 DOC 轉換為 XLAM (Excel 啟用宏的加載項)
將 DOC 轉換為 XLS (Microsoft Excel 二進制格式)
將 DOC 轉換為 XLSB (Excel 二進制工作簿)
將 DOC 轉換為 XLSM (啟用宏的電子表格)
將 DOC 轉換為 XLSX (打開 XML 工作簿)
將 DOC 轉換為 XLT (Excel 97 - 2003 模板)
將 DOC 轉換為 XLTM (Excel 啟用宏的模板)

什麼是 DOC 文件格式

Microsoft Word 二進製文件格式 (DOC) 是 Microsoft Office Word 使用的專有文檔文件格式。它表示獨立於任何特定計算機體系結構或操作系統的文檔結構。 DOC 格式作為一個容器文件,利用二進制格式存儲各種類型的數據,包括格式化文本、圖像、圖表等。 DOC 格式的二進制性質使其無法被人類閱讀,但存在一些程序,例如 Microsoft Word 和 LibreOffice,可以讀取和寫入 DOC 文件。

DOC 格式最初是早在 1987 年就在 Word for Windows 2.0 中引入。此後經歷了多次修訂,最近一次迭代是 Office 2007 中引入的 Office Open XML 格式。DOC 格式的主要優勢之一在於它與 Microsoft Word 的兼容性,全球使用最廣泛的文字處理應用程序之一。這種兼容性允許用戶使用 Microsoft Word 創建和修改文檔,並方便地與也使用該應用程序的其他人共享它們。此外,許多其他文字處理應用程序具有讀取和寫入 DOC 格式的能力,使其成為文檔共享目的的多功能選擇。

DOC 格式的廣泛採用源於它與 Microsoft Word 的集成,為用戶提供了一個強大且功能豐富的環境來創建和管理文檔。該格式的靈活性超越了 Microsoft Word,使用戶能夠使用其他文字處理軟件處理 DOC 文件。這種多功能性確保了用戶之間的無縫文檔協作和互換性,無論他們選擇何種文字處理應用程序。

什麼是 PST 文件格式

Outlook 個人存儲表 (PST) 文件格式是 Microsoft Outlook 用於存儲電子郵件、聯繫人、日曆項目、任務和其他數據的專有文件格式。 PST 文件由 Microsoft Outlook 創建並用於桌面客戶端和基於 Web 的版本,即 Outlook 網頁版(以前稱為 Outlook Web App 或 OWA)。

PST 文件通常以 . pst 文件擴展名,並存儲在用戶本地計算機或網絡服務器上。它們充當所有 Outlook 數據的集中存儲庫,允許用戶即使在離線時也可以訪問他們的電子郵件、聯繫人和其他信息。

PST 文件的結構由多個層組成,包括根結構,它包含文件的整體組織,以及保存特定類型的 Outlook 項目的各種數據結構。這些結構可實現電子郵件、附件、文件夾和其他 Outlook 數據的高效存儲和檢索。

PST 文件具有最大大小限制,具體取決於所使用的 Outlook 版本。在早期版本的 Outlook(Outlook 2002 及更早版本)中,PST 文件大小限制為 2 GB。但是,在更高版本(Outlook 2003 及更高版本)中,PST 文件格式得到改進,大小限制增加到 20 GB(Outlook 2003 和 2007),然後增加到 50 GB(Outlook 2010 及更高版本)。此外,Outlook 2013 為 PST 文件引入了 Unicode 格式,允許更大的文件大小並更好地支持非英語語言。

管理和維護 PST 文件對於確保最佳性能和數據完整性至關重要。定期備份和定期文件維護(例如壓縮和修復 PST 文件)有助於防止損壞和數據丟失。