通过 Java 将 DOCM 转换为 CSV 或在线应用程序

无需使用 Microsoft® Word 或 Microsoft® Excel 即可将 DOCM 转换为 CSV 的 On Premise Java API

 

通过 Aspose.Total for Java 将 DOCM 转换为 CSV 是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 DOCM 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 CSV。

将 DOCM 转换为 CSV 的 Java API

  1. 使用 Document 类打开 DOCM 文件
  2. 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 DOCM 转换为 HTML ) 方法
  3. 使用 Workbook 类加载 HTML 文档
  4. 使用 Save 将文档保存为 CSV 格式方法

转换要求

从您可以直接从基于 Maven 的项目轻松地使用 Aspose.Total for Java 并在您的 pom.xml 中包含库。

或者,您可以从 下载 获取 ZIP 文件。

免费的 DOCM 到 CSV 在线转换器

通过 Java 从 DOCM 文档中删除未使用的信息

Document 在将 DOCM 转换为 CSV 之前,您可以通过 Aspose.Words for Java 从 DOCM 文档中删除未使用的信息。有时您可能需要删除未使用或重复的信息以减少输出文档的大小和处理时间。 CleanupOptions 类允许您指定文档清理的选项。要从文档中删除重复的样式或仅未使用的样式或列表,您可以使用 Cleanup 方法。您可以使用 UnusedStylesUnusedBuiltinStyles 属性来检测和删除标记为“未使用”的样式。

通过 Java 将 CSV 文件保存到流

将 DOCM 转换为 CSV 后, Aspose.Cells for Java 使您能够将文档保存为流式传输。如果您需要将文件保存到 Stream 那么您应该创建一个 FileOutputStream 对象,然后 save 通过调用 Workbook 的 save 方法将文件保存到该 Stream 对象目的。

``` 将**DOCM(启用宏的Word文档)**转换为**CSV(逗号分隔值)**对于将表格化或结构化文本数据提取为轻量级、平台无关的格式至关重要。虽然DOCM文件是设计用于宏和格式设置的富文本文档,但CSV文件提供了一个干净、通用的结构,用于存储和共享数据。这种转换通过将复杂的基于Word的数据转换为易于阅读的电子表格,与数据库、分析工具和机器学习流程无缝集成,简化了工作流程。

主要用例

  • 将数据迁移到数据库
    将DOCM表格转换为CSV格式,以便快速导入SQL和NoSQL数据库。

  • 将文档表格导入分析软件
    从Word中提取结构化内容,转换为准备好供Power BI、Tableau或Excel等BI平台使用的CSV文件。

  • 为机器学习准备原始数据
    将DOCM表格格式化为CSV,以确保与ML框架(TensorFlow、PyTorch、Scikit-learn)兼容。

  • 在平台间共享结构化信息
    使用CSV文件作为轻量级媒介,在操作系统、云应用和协作者之间交换表格数据。

自动化场景

  • DOCM到CSV批量转换器
    自动处理多个DOCM文件,将其转换为CSV格式,用于大规模数据处理。

  • 从Word宏自动提取表格
    利用宏脚本或自动化工具,直接检测和转换Word表格为结构化的CSV文件。

  • 将CSV输出与BI工具集成的数据管道工作流
    将DOCM到CSV转换纳入ETL流程,实现实时更新和分析就绪数据集。

使用Java 探索DOCM转换选项

将DOCM转换为EXCEL (电子表格文件格式)