通过 Java 将 DOC 转换为 JSON 格式

无需使用 Microsoft® Word 或 Microsoft® Excel 即可将 DOC 转换为 JSON 的 On Premise Java API

 

通过 Aspose.Total for Java 将 DOC 转换为 JSON 格式是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 DOC 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 JSON。

通过 Java 将 DOC 转换为 JSON 格式

  1. 使用 Document 类打开 DOC 文件
  2. 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 DOC 转换为 HTML ) 方法
  3. 使用 Workbook 类加载 HTML 文档
  4. 使用 [Save]( https://reference.aspose.com/cells/java/com.aspose.cells/workbook#save(java.lang.String,%20com.aspose.cells.) 将文档保存为 JSON 格式方法

转换要求

从您可以直接从基于 Maven 的项目轻松地使用 Aspose.Total for Java 并在您的 pom.xml 中包含库。

或者,您可以从 下载 获取 ZIP 文件。

通过 Java 将受保护的 DOC 转换为 JSON 格式

使用 API,您还可以打开受密码保护的文档。如果您的输入 DOC 文档受密码保护,则您无法在不使用密码的情况下将其转换为 JSON 格式。 API 允许您通过在 LoadOptions 对象中传递正确的密码来打开加密的文档。以下代码示例显示了如何尝试使用密码打开加密文档:

通过 Java 将 DOC 转换为 Range 中的 JSON

在将 DOC 转换为 JSON 时,您还可以将范围设置为输出 JSON 格式。为了设置范围,您可以使用 Workbook 类打开转换后的 HTML,使用 Cells.createRange 方法创建要导出的数据范围,使用 Range 和 ExportRangeToJsonOptions 的引用调用 JsonUtility.exportRangeToJson 方法并将字符串 JSON 数据写入文件通过BufferedWriter.write 方法。

使用Java 探索DOC转换选项

将DOC转换为CSV (逗号分隔值)
将DOC转换为DIF (数据交换格式)
将DOC转换为EXCEL (电子表格文件格式)
将DOC转换为FODS (OpenDocument 平面 XML 电子表格)
将DOC转换为ODS (OpenDocument电子表格)
将DOC转换为SXC (StarSuite Calc 电子表格)
将DOC转换为TSV (制表符分隔值)
将DOC转换为XLAM (Excel 启用宏的加载项)
将DOC转换为XLS (Microsoft Excel 二进制格式)
将DOC转换为XLSB (Excel 二进制工作簿)
将DOC转换为XLSM (启用宏的电子表格)
将DOC转换为XLSX (打开 XML 工作簿)
将DOC转换为XLT (Excel 97 - 2003 模板)
将DOC转换为XLTM (Excel 启用宏的模板)
将DOC转换为XLTX (Excel模板)
将DOC转换为ODP (OpenDocument 演示文稿格式)
将DOC转换为POT (Microsoft PowerPoint 模板文件)
将DOC转换为POTM (Microsoft PowerPoint 模板文件)
将DOC转换为POTX (Microsoft PowerPoint 模板演示)
将DOC转换为PPTX (打开 XML 表示格式)
将DOC转换为PPS (PowerPoint 幻灯片放映)
将DOC转换为PPSM (启用宏的幻灯片放映)
将DOC转换为PPSX (PowerPoint 幻灯片放映)
将DOC转换为PPT (PowerPoint演示文稿)
将DOC转换为PPTM (启用宏的演示文稿文件)
将DOC转换为PPTX (打开 XML 表示格式)

什么是DOC文件格式

Microsoft Word 二进制文件格式 (DOC) 是 Microsoft Office Word 使用的专有文档文件格式。它表示独立于任何特定计算机体系结构或操作系统的文档结构。 DOC 格式作为一个容器文件,利用二进制格式存储各种类型的数据,包括格式化文本、图像、图表等。 DOC 格式的二进制性质使其无法被人类阅读,但存在一些程序,例如 Microsoft Word 和 LibreOffice,可以读取和写入 DOC 文件。

DOC 格式最初是早在 1987 年就在 Word for Windows 2.0 中引入。此后经历了多次修订,最近一次迭代是 Office 2007 中引入的 Office Open XML 格式。DOC 格式的主要优势之一在于它与 Microsoft Word 的兼容性,全球使用最广泛的文字处理应用程序之一。这种兼容性允许用户使用 Microsoft Word 创建和修改文档,并方便地与也使用该应用程序的其他人共享它们。此外,许多其他文字处理应用程序具有读取和写入 DOC 格式的能力,使其成为文档共享目的的多功能选择。

DOC 格式的广泛采用源于它与 Microsoft Word 的集成,为用户提供了一个强大且功能丰富的环境来创建和管理文档。该格式的灵活性超越了 Microsoft Word,使用户能够使用其他文字处理软件处理 DOC 文件。这种多功能性确保了用户之间的无缝文档协作和互换性,无论他们选择何种文字处理应用程序。

什么是JSON文件格式

JSON(JavaScript 对象表示法)文件格式是一种轻量级且广泛使用的数据交换格式。它源自 JavaScript 编程语言,但现在与语言无关,并受到各种编程语言的支持。 JSON 文件以结构化和可读的格式存储数据,使它们易于人和机器理解和处理。

JSON 文件由按层次结构组织的键值对组成。它们使用对象(包含在花括号 {} 中)和数组(包含在方括号 [] 中)以简单直观的方式表示数据。每个键都与对应的值配对,该值可以是字符串、数字、布尔值、空值、对象或数组。这种灵活性允许 JSON 处理复杂和嵌套的数据结构。

JSON 的主要优点之一是它的简单性和易用性。它的轻量级特性和最少的语法使其能够高效地通过网络传输数据和在文件中存储。 JSON 文件通常用于 Web 服务器和客户端之间的数据交换,以及用于配置文件、API 和存储结构化数据。

JSON 文件是人类可读的,并且可以使用文本轻松理解和修改编辑。它们也是机器可读的,允许应用程序有效地解析和处理 JSON 数据。许多编程语言都提供了用于处理 JSON 的内置库或包,从而简化了 JSON 数据的解析和序列化。