通过 Java 将 DOC 转换为 EXCEL 或在线应用程序

无需使用 Microsoft® Word 或 Microsoft® Excel 即可将 DOC 转换为 EXCEL 的 On Premise Java API

 

通过 Aspose.Total for Java 将 DOC 转换为 EXCEL 是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 DOC 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 EXCEL。

将 DOC 转换为 EXCEL 的 Java API

  1. 使用 Document 类打开 DOC 文件
  2. 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 DOC 转换为 HTML ) 方法
  3. 使用 Workbook 类加载 HTML 文档
  4. 使用 [Save]https://reference.aspose.com/cells/java/com.aspose.cells/workbook#save(java.lang.String,%20com.aspose.cells.SaveOptions)) 方法

转换要求

从您可以直接从基于 Maven 的项目轻松地使用 Aspose.Total for Java 并在您的 pom.xml 中包含库。

或者,您可以从 下载 获取 ZIP 文件。

免费的 DOC 到 EXCEL 在线转换器

通过 Java 从 DOC 文档中删除未使用的信息

在将 DOC 转换为 EXCEL 之前,您可以通过 Aspose.Words for Java 从 DOC 文档中删除未使用的信息。有时您可能需要删除未使用或重复的信息以减少输出文档的大小和处理时间。 CleanupOptions 类允许您指定文档清理的选项。要从文档中删除重复的样式或仅未使用的样式或列表,您可以使用 Cleanup 方法。您可以使用 UnusedStylesUnusedBuiltinStyles 属性来检测和删除标记为“未使用”的样式。

https://reference.aspose.com/cells/java/com.aspose.cells/workbook#save(java.io.OutputStream.%20com.aspose.cells.SaveOptions))

通过 Java 将 EXCEL 文件保存到流

将 DOC 转换为 EXCEL 后, Aspose.Cells for Java 使您能够将文档保存为流式传输。如果您需要将文件保存到 Stream 那么您应该创建一个 FileOutputStream 对象,然后 save 通过调用 Workbook 的 save 方法将文件保存到该 Stream 对象目的。

使用Java 探索DOC转换选项

将DOC转换为CSV (逗号分隔值)
将DOC转换为DIF (数据交换格式)
将DOC转换为FODS (OpenDocument 平面 XML 电子表格)
将DOC转换为ODS (OpenDocument电子表格)
将DOC转换为SXC (StarSuite Calc 电子表格)
将DOC转换为TSV (制表符分隔值)
将DOC转换为XLAM (Excel 启用宏的加载项)
将DOC转换为XLS (Microsoft Excel 二进制格式)
将DOC转换为XLSB (Excel 二进制工作簿)
将DOC转换为XLSM (启用宏的电子表格)
将DOC转换为XLSX (打开 XML 工作簿)
将DOC转换为XLT (Excel 97 - 2003 模板)
将DOC转换为XLTM (Excel 启用宏的模板)
将DOC转换为XLTX (Excel模板)
将DOC转换为JSON (JavaScript 对象表示法文件)
将DOC转换为ODP (OpenDocument 演示文稿格式)
将DOC转换为POT (Microsoft PowerPoint 模板文件)
将DOC转换为POTM (Microsoft PowerPoint 模板文件)
将DOC转换为POTX (Microsoft PowerPoint 模板演示)
将DOC转换为PPTX (打开 XML 表示格式)
将DOC转换为PPS (PowerPoint 幻灯片放映)
将DOC转换为PPSM (启用宏的幻灯片放映)
将DOC转换为PPSX (PowerPoint 幻灯片放映)
将DOC转换为PPT (PowerPoint演示文稿)
将DOC转换为PPTM (启用宏的演示文稿文件)
将DOC转换为PPTX (打开 XML 表示格式)

什么是DOC文件格式

Microsoft Word 二进制文件格式 (DOC) 是 Microsoft Office Word 使用的专有文档文件格式。它表示独立于任何特定计算机体系结构或操作系统的文档结构。 DOC 格式作为一个容器文件,利用二进制格式存储各种类型的数据,包括格式化文本、图像、图表等。 DOC 格式的二进制性质使其无法被人类阅读,但存在一些程序,例如 Microsoft Word 和 LibreOffice,可以读取和写入 DOC 文件。

DOC 格式最初是早在 1987 年就在 Word for Windows 2.0 中引入。此后经历了多次修订,最近一次迭代是 Office 2007 中引入的 Office Open XML 格式。DOC 格式的主要优势之一在于它与 Microsoft Word 的兼容性,全球使用最广泛的文字处理应用程序之一。这种兼容性允许用户使用 Microsoft Word 创建和修改文档,并方便地与也使用该应用程序的其他人共享它们。此外,许多其他文字处理应用程序具有读取和写入 DOC 格式的能力,使其成为文档共享目的的多功能选择。

DOC 格式的广泛采用源于它与 Microsoft Word 的集成,为用户提供了一个强大且功能丰富的环境来创建和管理文档。该格式的灵活性超越了 Microsoft Word,使用户能够使用其他文字处理软件处理 DOC 文件。这种多功能性确保了用户之间的无缝文档协作和互换性,无论他们选择何种文字处理应用程序。

什么是EXCEL文件格式

Microsoft Excel 是一种广泛使用的电子表格软件,以其以各种文件格式保存和共享数据的多功能性而闻名。 Excel 中最常用的文件格式包括 XLS、XLSX、CSV、TXT、PDF、ODS 和 DBF。 XLS 是默认的文件格式,而 XLSX 更新、更高效,已经流行起来。 CSV 和 TXT 格式由纯文本数据组成,具有与各种软件应用程序的兼容性。由于 PDF 文件能够保留格式和布局,因此被广泛用于共享和发布 Excel 数据。 ODS 文件是开源的,提供与不同软件应用程序的兼容性,使其成为协作项目的理想选择。与 dBASE 软件兼容的 DBF 文件在处理大型数据集时证明是有利的。此外,还有一些不太常用的文件格式,如 XLT、XLTX、XLTM 和 XML,它们主要用作模板或促进不同软件应用程序之间的数据交换。选择合适的文件格式取决于多种因素,例如预期的应用程序、与其他软件的兼容性以及手头数据的大小和复杂性。通过考虑这些方面,用户可以做出明智的决定来优化他们的 Excel 体验。