通过 Java 将 DOCX 转换为 JSON 格式

无需使用 Microsoft® Word 或 Microsoft® Excel 即可将 DOCX 转换为 JSON 的 On Premise Java API

 

通过 Aspose.Total for Java 将 DOCX 转换为 JSON 格式是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 DOCX 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 JSON。

通过 Java 将 DOCX 转换为 JSON 格式

  1. 使用 Document 类打开 DOCX 文件
  2. 使用 Save 将 DOCX 转换为 HTML 方法
  3. 使用 Workbook 类加载 HTML 文档
  4. 使用 [Save]( https://reference.aspose.com/cells/java/com.aspose.cells/workbook#save(java.lang.String,%20com.aspose.cells.) 将文档保存为 JSON 格式方法

转换要求

从您可以直接从基于 Maven 的项目轻松地使用 Aspose.Total for Java 并在您的 pom.xml 中包含库。

或者,您可以从 下载 获取 ZIP 文件。

通过 Java 将受保护的 DOCX 转换为 JSON 格式

使用 API,您还可以打开受密码保护的文档。如果您的输入 DOCX 文档受密码保护,则您无法在不使用密码的情况下将其转换为 JSON 格式。 API 允许您通过在 LoadOptions 对象中传递正确的密码来打开加密的文档。以下代码示例显示了如何尝试使用密码打开加密文档:

通过 Java 将 DOCX 转换为 Range 中的 JSON

在将 DOCX 转换为 JSON 时,您还可以将范围设置为输出 JSON 格式。为了设置范围,您可以使用 Workbook 类打开转换后的 HTML,使用 Cells.createRange 方法创建要导出的数据范围,使用 Range 和 ExportRangeToJsonOptions 的引用调用 JsonUtility.exportRangeToJson 方法并将字符串 JSON 数据写入文件通过BufferedWriter.write 方法。

使用Java 探索DOCX转换选项

将DOCX转换为CSV (逗号分隔值)
将DOCX转换为DIF (数据交换格式)
将DOCX转换为EXCEL (电子表格文件格式)
将DOCX转换为FODS (OpenDocument 平面 XML 电子表格)
将DOCX转换为ODS (OpenDocument电子表格)
将DOCX转换为SXC (StarSuite Calc 电子表格)
将DOCX转换为TSV (制表符分隔值)
将DOCX转换为XLAM (Excel 启用宏的加载项)
将DOCX转换为XLS (Microsoft Excel 二进制格式)
将DOCX转换为XLSB (Excel 二进制工作簿)
将DOCX转换为XLSM (启用宏的电子表格)
将DOCX转换为XLSX (打开 XML 工作簿)
将DOCX转换为XLT (Excel 97 - 2003 模板)
将DOCX转换为XLTM (Excel 启用宏的模板)
将DOCX转换为XLTX (Excel模板)
将DOCX转换为ODP (OpenDocument 演示文稿格式)
将DOCX转换为POT (Microsoft PowerPoint 模板文件)
将DOCX转换为POTM (Microsoft PowerPoint 模板文件)
将DOCX转换为POTX (Microsoft PowerPoint 模板演示)
将DOCX转换为PPTX (打开 XML 表示格式)
将DOCX转换为PPS (PowerPoint 幻灯片放映)
将DOCX转换为PPSM (启用宏的幻灯片放映)
将DOCX转换为PPSX (PowerPoint 幻灯片放映)
将DOCX转换为PPT (PowerPoint演示文稿)
将DOCX转换为PPTM (启用宏的演示文稿文件)
将DOCX转换为PPTX (打开 XML 表示格式)

什么是DOCX文件格式

DOCX 是 Microsoft 专门为其文字处理软件 Microsoft Word 开发的一种文件格式。其目的是提供一种通用且可靠的格式,用于跨各种平台和设备创建和共享文档。 DOCX 文件在商业、学术界和个人通信中得到广泛采用,具有众多优势。

DOCX 格式的一个关键优势是它与其他 Microsoft Office 应用程序(如 Excel 和 PowerPoint)无缝集成。这种集成使用户能够毫不费力地将表格、图表和多媒体内容合并到他们的文档中,从而增强他们的视觉吸引力和整体效率。此外,DOCX 文件可以方便地转换为其他广泛使用的格式,例如 PDF、HTML 和 RTF,确保跨不同系统的兼容性和可移植性。

DOCX 格式的灵活性扩展到它对高级格式设置选项的支持.用户可以使用样式、主题和模板来创建具有一致品牌和格式的具有专业外观的文档。这消除了对复杂技术技能的需求,使用户能够毫不费力地制作精美且具有视觉吸引力的内容。

DOCX 的另一个显着优势是它与各种软件和设备的广泛兼容性,包括流行的操作系统,例如Windows、macOS 和 Linux。这种兼容性确保可以跨不同环境无缝访问、编辑和共享文档,从而促进高效协作和沟通。

什么是JSON文件格式

JSON(JavaScript 对象表示法)文件格式是一种轻量级且广泛使用的数据交换格式。它源自 JavaScript 编程语言,但现在与语言无关,并受到各种编程语言的支持。 JSON 文件以结构化和可读的格式存储数据,使它们易于人和机器理解和处理。

JSON 文件由按层次结构组织的键值对组成。它们使用对象(包含在花括号 {} 中)和数组(包含在方括号 [] 中)以简单直观的方式表示数据。每个键都与对应的值配对,该值可以是字符串、数字、布尔值、空值、对象或数组。这种灵活性允许 JSON 处理复杂和嵌套的数据结构。

JSON 的主要优点之一是它的简单性和易用性。它的轻量级特性和最少的语法使其能够高效地通过网络传输数据和在文件中存储。 JSON 文件通常用于 Web 服务器和客户端之间的数据交换,以及用于配置文件、API 和存储结构化数据。

JSON 文件是人类可读的,并且可以使用文本轻松理解和修改编辑。它们也是机器可读的,允许应用程序有效地解析和处理 JSON 数据。许多编程语言都提供了用于处理 JSON 的内置库或包,从而简化了 JSON 数据的解析和序列化。