通过 Aspose.Total for Java 将 WORD 转换为 EXCEL 是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 WORD 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 EXCEL。
将 WORD 转换为 EXCEL 的 Java API
- 使用 Document 类打开 WORD 文件
- 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 WORD 转换为 HTML ) 方法
- 使用 Workbook 类加载 HTML 文档
- 使用 [Save]https://reference.aspose.com/cells/java/com.aspose.cells/workbook#save(java.lang.String,%20com.aspose.cells.SaveOptions)) 方法
免费的 WORD 到 EXCEL 在线转换器
通过 Java 从 WORD 文档中删除未使用的信息
在将 WORD 转换为 EXCEL 之前,您可以通过 Aspose.Words for Java 从 WORD 文档中删除未使用的信息。有时您可能需要删除未使用或重复的信息以减少输出文档的大小和处理时间。 CleanupOptions 类允许您指定文档清理的选项。要从文档中删除重复的样式或仅未使用的样式或列表,您可以使用 Cleanup 方法。您可以使用 UnusedStyles 和 UnusedBuiltinStyles 属性来检测和删除标记为“未使用”的样式。
通过 Java 将 EXCEL 文件保存到流
将 WORD 转换为 EXCEL 后, Aspose.Cells for Java 使您能够将文档保存为流式传输。如果您需要将文件保存到 Stream 那么您应该创建一个 FileOutputStream 对象,然后 save 通过调用 Workbook 的 save 方法将文件保存到该 Stream 对象目的。
使用Java 探索WORD转换选项
什么是WORD文件格式
Microsoft Word 是一种广泛使用的文字处理软件,它提供了一系列用于保存和共享文档的文件格式。默认格式是 DOC,这种格式在早期版本的 Word 中已经流行。然而,更新和更高效的格式 DOCX 因其更小的文件大小和增强的数据恢复能力而成为默认选择。 PDF 是另一种常用格式,它保留格式和布局,同时在任何设备上都易于查看。
为了与不同的软件应用程序兼容,RTF 格式用作可以轻松交换的纯文本格式。另一方面,HTML 专门用于创建网页。 ODT 是一种开源格式,可确保与各种软件应用程序的兼容性,而 TXT 是一种仅包含文本本身的简单纯文本格式。
选择合适的格式取决于几个因素,包括预期的应用程序、兼容性与其他软件,以及文档的大小和复杂性。通过熟悉可用的格式,用户可以优化他们的工作流程,并就最适合其特定文档的格式做出明智的决定。
什么是EXCEL文件格式
Microsoft Excel 是一种广泛使用的电子表格软件,以其以各种文件格式保存和共享数据的多功能性而闻名。 Excel 中最常用的文件格式包括 XLS、XLSX、CSV、TXT、PDF、ODS 和 DBF。 XLS 是默认的文件格式,而 XLSX 更新、更高效,已经流行起来。 CSV 和 TXT 格式由纯文本数据组成,具有与各种软件应用程序的兼容性。由于 PDF 文件能够保留格式和布局,因此被广泛用于共享和发布 Excel 数据。 ODS 文件是开源的,提供与不同软件应用程序的兼容性,使其成为协作项目的理想选择。与 dBASE 软件兼容的 DBF 文件在处理大型数据集时证明是有利的。此外,还有一些不太常用的文件格式,如 XLT、XLTX、XLTM 和 XML,它们主要用作模板或促进不同软件应用程序之间的数据交换。选择合适的文件格式取决于多种因素,例如预期的应用程序、与其他软件的兼容性以及手头数据的大小和复杂性。通过考虑这些方面,用户可以做出明智的决定来优化他们的 Excel 体验。