使用 Python 将 DOC 转换为图像

在您的 Python 应用程序中将 DOC 转换为 JPG、TIFF、BMP、PNG 和 GIF 图像,而无需安装 Microsoft Word®

 

对于尝试在应用程序中添加 DOC 到 PNG、BMP、TIFF、JPEG 和 GIF 图像转换功能的 Python 开发人员。 Aspose.Total for Python via .NET API 可以帮助导入和导出图像和 Word 文件以及自动化转换过程。 它是处理不同格式的各种 API 的完整包。

我们使用 Aspose.Total for Python via .NET 包中的 Aspose.Words for Python via .NET API 将 DOC 添加到 JPG、PNG、GIF、BMP 和 TIFF 图像转换功能。 对于只是转换,它只是两行代码。 加载 DOC 文件并使用适当的图像路径以及相关格式的 SaveFormat 调用 save 方法。 但是如果需要设置额外的信息,比如设置水平和垂直分辨率、比例、像素格式、亮度等,那么所有这些都可以使用 ImageSaveOptions 类。 使用 ImageSaveOptions 可以轻松地将特定的 DOC 页面渲染为具有透明或彩色背景的图像,在渲染时指定分辨率,配置压缩等等。 根据需求,可以按照自己的需求使用,这里是另一种 Word To Image 转换的方式。

如何 在 Python 中将 DOC 转换为图像

转换要求

  • 对于 DOC 到图像(JPG、PNG、GIF、BMP、TIFF)的转换,需要 Python 3.5 或更高版本
  • 直接从 PyPI ( Aspose.Words ) 引用项目中的 API
  • 或者使用以下 pip 命令 pip install aspose.words
  • 此外,基于 Microsoft Windows 或 Linux 的操作系统(请参阅 Words 的更多信息)和 Linux 检查 gcc 和 libpython 的附加要求,并按照 INSTALL 的分步说明进行操作。
 

在 Python 中将 DOC 保存到图像 - 简单转换

 
 

具有特定选项的 DOC 到图像转换

 

探索 DOC Python 的转换选项

将CSV转换为DOC (逗号分隔值)
将CSV转换为DOCM (逗号分隔值)
将CSV转换为DOCX (逗号分隔值)
将CSV转换为DOT (逗号分隔值)
将CSV转换为DOTM (逗号分隔值)
将CSV转换为DOTX (逗号分隔值)
将CSV转换为MOBI (逗号分隔值)
将CSV转换为ODT (逗号分隔值)
将CSV转换为OTT (逗号分隔值)
将CSV转换为POT (逗号分隔值)
将CSV转换为POTX (逗号分隔值)
将CSV转换为POWERPOINT (逗号分隔值)
将CSV转换为PPS (逗号分隔值)
将CSV转换为PPSM (逗号分隔值)
将CSV转换为PPSX (逗号分隔值)
将CSV转换为PPT (逗号分隔值)
将CSV转换为PPTM (逗号分隔值)
将CSV转换为PPTX (逗号分隔值)
将CSV转换为RTF (逗号分隔值)
将CSV转换为WORD (逗号分隔值)
将CSV转换为WORDML (逗号分隔值)
将DIF转换为DOC (数据交换格式)
将DIF转换为DOCM (数据交换格式)
将DIF转换为DOCX (数据交换格式)
将DIF转换为DOT (数据交换格式)
将DIF转换为DOTM (数据交换格式)
将DIF转换为DOTX (数据交换格式)
将DIF转换为MOBI (数据交换格式)
将DIF转换为ODT (数据交换格式)
将DIF转换为OTT (数据交换格式)
将DIF转换为RTF (数据交换格式)
将DIF转换为WORD (数据交换格式)
将DIF转换为WORDML (数据交换格式)
将DOC转换为CSV (Microsoft Word 二进制格式)
将DOC转换为DIF (Microsoft Word 二进制格式)
将DOC转换为EXCEL (Microsoft Word 二进制格式)
将DOC转换为FODS (Microsoft Word 二进制格式)
将DOC转换为ODS (Microsoft Word 二进制格式)
将DOC转换为SXC (Microsoft Word 二进制格式)
将DOC转换为TSV (Microsoft Word 二进制格式)

什么是DOC文件格式

Microsoft Word 二进制文件格式 (DOC) 是 Microsoft Office Word 使用的专有文档文件格式。它表示独立于任何特定计算机体系结构或操作系统的文档结构。 DOC 格式作为一个容器文件,利用二进制格式存储各种类型的数据,包括格式化文本、图像、图表等。 DOC 格式的二进制性质使其无法被人类阅读,但存在一些程序,例如 Microsoft Word 和 LibreOffice,可以读取和写入 DOC 文件。

DOC 格式最初是早在 1987 年就在 Word for Windows 2.0 中引入。此后经历了多次修订,最近一次迭代是 Office 2007 中引入的 Office Open XML 格式。DOC 格式的主要优势之一在于它与 Microsoft Word 的兼容性,全球使用最广泛的文字处理应用程序之一。这种兼容性允许用户使用 Microsoft Word 创建和修改文档,并方便地与也使用该应用程序的其他人共享它们。此外,许多其他文字处理应用程序具有读取和写入 DOC 格式的能力,使其成为文档共享目的的多功能选择。

DOC 格式的广泛采用源于它与 Microsoft Word 的集成,为用户提供了一个强大且功能丰富的环境来创建和管理文档。该格式的灵活性超越了 Microsoft Word,使用户能够使用其他文字处理软件处理 DOC 文件。这种多功能性确保了用户之间的无缝文档协作和互换性,无论他们选择何种文字处理应用程序。