使用 Python 将 PDF 转换为 OST
在您的 Python 应用程序中将 PDF 转换为 OST,而无需安装 Microsoft Word® 或 Outlook。
对于 Python 开发人员,谁正在尝试在应用程序中添加 PDF 到 OST 转换功能? Aspose.Total for Python via .NET API 可以帮助自动化转换过程。 它是处理不同格式的各种 API 的完整包,包括电子邮件、图像和 Microsoft Word 格式。 作为 Aspose.Total for Python via .NET 包的一部分的 Aspose.Words for Python via .NET 和 Aspose.Email for Python via .NET API 使用 Python 使这种转换变得容易。 这是一个两步过程,首先加载 PDF 文件并通过 Aspose.Words for Python via .NET 将其呈现为 HTML。 其次使用 Aspose.Email for Python via .NET 加载转换后的 HTML 并将其保存为 OST 格式。
如何在 Python 中将 PDF 转换为 OST
- 使用 Document 类打开源 PDF 文件
- 调用
save方法,同时指定输出 HTML 文件路径和相关的 HTML Save 选项作为参数。 所以你的 PDF 文件在指定的路径被转换成 HTML - 现在使用 MailMessage.load 加载保存的 HTML 文件
- 使用相关文件路径调用 save 方法。所以最后PDF被转换了
转换要求
- 对于 PDF 到 OST 的转换,需要 Python 3.5 或更高版本
- 直接从 PyPI 引用项目中的 API( Aspose.Words 和 Aspose.Email )
- 或者使用以下 pip 命令
pip install aspose.words和pip install Aspose.Email-for-Python-via-NET - 此外,基于 Microsoft Windows 或 Linux 的操作系统(有关 Words 和 Email 的更多信息)和 Linux 检查 gcc 和 libpython 的附加要求,并按照分步说明进行操作 INSTALL
在 Python 中将 PDF 保存为 OST
使用 Python API 将 PDF 转换为 OST 支持的工作流,适用于需要将 PDF 派生的内容合并到电子邮件客户端环境使用的离线邮箱数据结构中的场景。这在迁移、归档和同步相关的文档处理过程中可能非常有用。
自动化此转换有助于减少大规模数据准备和邮箱管理任务中的人工工作量。它在企业场景中特别有价值,因为文档内容必须与结构化的离线通信存储库保持一致。
关键用例
离线邮件数据准备
将基于 PDF 的内容转换后用于依赖离线存储的邮箱环境。归档和迁移支持
在涉及邮箱迁移或保存的工作流中使用 PDF 派生的输出。结构化通信存储
将文档信息集成到有组织的离线邮件数据系统中。企业内容处理
为具有基于邮箱存储需求的环境准备基于文档的记录。
自动化场景
迁移工作流自动化
Python 脚本可以在大规模下支持文档到邮箱的转换过程。归档系统集成
转换后的内容可供管理离线消息数据的企业存储库使用。批量存储库准备
大量 PDF 集合可以通过编程方式转换,以适应结构化的邮箱工作流。触发式数据处理
文档摄取管道可以自动为离线邮件环境准备输出。
探索 PDF Python 的转换选项
将PDF转换为EMAIL
(电子邮件文件)
将PDF转换为EML
(电子邮件信息)
将PDF转换为EMLX
(Apple 邮件消息)
将PDF转换为ICS
(日历文件)
将PDF转换为MBOX
(电子邮件邮箱文件)
将PDF转换为MHTML
(MIME HTML)
将PDF转换为MSG
(Outlook 邮件项目文件)
将PDF转换为OFT
(Outlook 文件模板)
将PDF转换为PST
(Outlook 个人存储表)
将PDF转换为VCF
(电子名片档案)