使用 Python 将 DOC 转换为 PST

在您的 Python 应用程序中将 DOC 转换为 PST,而无需安装 Microsoft Word® 或 Outlook。

 

对于 Python 开发人员,谁正在尝试在应用程序中添加 DOC 到 PST 转换功能? Aspose.Total for Python via .NET API 可以帮助自动化转换过程。 它是处理不同格式的各种 API 的完整包,包括电子邮件、图像和 Microsoft Word 格式。 作为 Aspose.Total for Python via .NET 包的一部分的 Aspose.Words for Python via .NETAspose.Email for Python via .NET API 使用 Python 使这种转换变得容易。 这是一个两步过程,首先加载 DOC 文件并通过 Aspose.Words for Python via .NET 将其呈现为 HTML。 其次使用 Aspose.Email for Python via .NET 加载转换后的 HTML 并将其保存为 PST 格式。

如何在 Python 中将 DOC 转换为 PST

  • 使用 Document 类打开源 DOC 文件
  • 调用 save 方法,同时指定输出 HTML 文件路径和相关的 HTML Save 选项作为参数。 所以你的 DOC 文件在指定的路径被转换成 HTML
  • 现在使用 MailMessage.load 加载保存的 HTML 文件
  • 使用相关文件路径调用 save 方法。所以最后DOC被转换了

转换要求

  • 对于 DOC 到 PST 的转换,需要 Python 3.5 或更高版本
  • 直接从 PyPI 引用项目中的 API( Aspose.WordsAspose.Email
  • 或者使用以下 pip 命令 pip install aspose.wordspip install Aspose.Email-for-Python-via-NET
  • 此外,基于 Microsoft Windows 或 Linux 的操作系统(有关 WordsEmail 的更多信息)和 Linux 检查 gcc 和 libpython 的附加要求,并按照分步说明进行操作 INSTALL
 

在 Python 中将 DOC 保存为 PST

 

探索 DOC Python 的转换选项

将DOC转换为CSV (逗号分隔值)
将DOC转换为DIF (数据交换格式)
将DOC转换为EXCEL (电子表格文件格式)
将DOC转换为FODS (OpenDocument 平面 XML 电子表格)
将DOC转换为ODS (OpenDocument电子表格)
将DOC转换为SXC (StarSuite Calc 电子表格)
将DOC转换为TSV (制表符分隔值)
将DOC转换为XLAM (Excel 启用宏的加载项)
将DOC转换为XLS (Microsoft Excel 二进制格式)
将DOC转换为XLSB (Excel 二进制工作簿)
将DOC转换为XLSM (启用宏的电子表格)
将DOC转换为XLSX (打开 XML 工作簿)
将DOC转换为XLT (Excel 97 - 2003 模板)
将DOC转换为XLTM (Excel 启用宏的模板)
将DOC转换为XLTX (Excel模板)
将DOC转换为EMAIL (电子邮件文件)
将DOC转换为EML (电子邮件信息)
将DOC转换为EMLX (Apple 邮件消息)
将DOC转换为ICS (日历文件)
将DOC转换为MBOX (电子邮件邮箱文件)
将DOC转换为MSG (Outlook 邮件项目文件)
将DOC转换为ODP (OpenDocument 演示文稿格式)
将DOC转换为OFT (Outlook 文件模板)
将DOC转换为OST (Outlook 离线存储表)
将DOC转换为POT (Microsoft PowerPoint 模板文件)
将DOC转换为POTM (Microsoft PowerPoint 模板文件)
将DOC转换为POTX (Microsoft PowerPoint 模板演示)
将DOC转换为PPS (PowerPoint 幻灯片放映)
将DOC转换为PPSM (启用宏的幻灯片放映)
将DOC转换为PPSX (PowerPoint 幻灯片放映)
将DOC转换为PPT (PowerPoint演示文稿)
将DOC转换为PPTM (启用宏的演示文稿文件)
将DOC转换为PPTX (打开 XML 表示格式)
将DOC转换为VCF (电子名片档案)

什么是DOC文件格式

Microsoft Word 二进制文件格式 (DOC) 是 Microsoft Office Word 使用的专有文档文件格式。它表示独立于任何特定计算机体系结构或操作系统的文档结构。 DOC 格式作为一个容器文件,利用二进制格式存储各种类型的数据,包括格式化文本、图像、图表等。 DOC 格式的二进制性质使其无法被人类阅读,但存在一些程序,例如 Microsoft Word 和 LibreOffice,可以读取和写入 DOC 文件。

DOC 格式最初是早在 1987 年就在 Word for Windows 2.0 中引入。此后经历了多次修订,最近一次迭代是 Office 2007 中引入的 Office Open XML 格式。DOC 格式的主要优势之一在于它与 Microsoft Word 的兼容性,全球使用最广泛的文字处理应用程序之一。这种兼容性允许用户使用 Microsoft Word 创建和修改文档,并方便地与也使用该应用程序的其他人共享它们。此外,许多其他文字处理应用程序具有读取和写入 DOC 格式的能力,使其成为文档共享目的的多功能选择。

DOC 格式的广泛采用源于它与 Microsoft Word 的集成,为用户提供了一个强大且功能丰富的环境来创建和管理文档。该格式的灵活性超越了 Microsoft Word,使用户能够使用其他文字处理软件处理 DOC 文件。这种多功能性确保了用户之间的无缝文档协作和互换性,无论他们选择何种文字处理应用程序。

什么是PST文件格式

Outlook 个人存储表 (PST) 文件格式是 Microsoft Outlook 用于存储电子邮件、联系人、日历项目、任务和其他数据的专有文件格式。 PST 文件由 Microsoft Outlook 创建并用于桌面客户端和基于 Web 的版本,即 Outlook 网页版(以前称为 Outlook Web App 或 OWA)。

PST 文件通常以 . pst 文件扩展名,并存储在用户本地计算机或网络服务器上。它们充当所有 Outlook 数据的集中存储库,允许用户即使在离线时也可以访问他们的电子邮件、联系人和其他信息。

PST 文件的结构由多个层组成,包括根结构,它包含文件的整体组织,以及保存特定类型的 Outlook 项目的各种数据结构。这些结构可实现电子邮件、附件、文件夹和其他 Outlook 数据的高效存储和检索。

PST 文件具有最大大小限制,具体取决于所使用的 Outlook 版本。在早期版本的 Outlook(Outlook 2002 及更早版本)中,PST 文件大小限制为 2 GB。但是,在更高版本(Outlook 2003 及更高版本)中,PST 文件格式得到改进,大小限制增加到 20 GB(Outlook 2003 和 2007),然后增加到 50 GB(Outlook 2010 及更高版本)。此外,Outlook 2013 为 PST 文件引入了 Unicode 格式,允许更大的文件大小并更好地支持非英语语言。

管理和维护 PST 文件对于确保最佳性能和数据完整性至关重要。定期备份和定期文件维护(例如压缩和修复 PST 文件)有助于防止损坏和数据丢失。