通过 Aspose.Total for Java 将 DOCM 转换为 CSV 是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 DOCM 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 CSV。
将 DOCM 转换为 CSV 的 Java API
- 使用 Document 类打开 DOCM 文件
- 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 DOCM 转换为 HTML ) 方法
- 使用 Workbook 类加载 HTML 文档
- 使用 Save 将文档保存为 CSV 格式方法
免费的 DOCM 到 CSV 在线转换器
通过 Java 从 DOCM 文档中删除未使用的信息
Document 在将 DOCM 转换为 CSV 之前,您可以通过 Aspose.Words for Java 从 DOCM 文档中删除未使用的信息。有时您可能需要删除未使用或重复的信息以减少输出文档的大小和处理时间。 CleanupOptions 类允许您指定文档清理的选项。要从文档中删除重复的样式或仅未使用的样式或列表,您可以使用 Cleanup 方法。您可以使用 UnusedStyles 和 UnusedBuiltinStyles 属性来检测和删除标记为“未使用”的样式。
通过 Java 将 CSV 文件保存到流
将 DOCM 转换为 CSV 后, Aspose.Cells for Java 使您能够将文档保存为流式传输。如果您需要将文件保存到 Stream 那么您应该创建一个 FileOutputStream 对象,然后 save 通过调用 Workbook 的 save 方法将文件保存到该 Stream 对象目的。
主要用例
将数据迁移到数据库
将DOCM表格转换为CSV格式,以便快速导入SQL和NoSQL数据库。将文档表格导入分析软件
从Word中提取结构化内容,转换为准备好供Power BI、Tableau或Excel等BI平台使用的CSV文件。为机器学习准备原始数据
将DOCM表格格式化为CSV,以确保与ML框架(TensorFlow、PyTorch、Scikit-learn)兼容。在平台间共享结构化信息
使用CSV文件作为轻量级媒介,在操作系统、云应用和协作者之间交换表格数据。
自动化场景
DOCM到CSV批量转换器
自动处理多个DOCM文件,将其转换为CSV格式,用于大规模数据处理。从Word宏自动提取表格
利用宏脚本或自动化工具,直接检测和转换Word表格为结构化的CSV文件。将CSV输出与BI工具集成的数据管道工作流
将DOCM到CSV转换纳入ETL流程,实现实时更新和分析就绪数据集。