通过 Aspose.Total for Java 将 WORDML 转换为 TSV 是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 WORDML 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 TSV。
将 WORDML 转换为 TSV 的 Java API
- 使用 Document 类打开 WORDML 文件
- 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 WORDML 转换为 HTML ) 方法
- 使用 Workbook 类加载 HTML 文档
- 使用 Save 将文档保存为 TSV 格式方法
免费的 WORDML 到 TSV 在线转换器
通过 Java 从 WORDML 文档中删除未使用的信息
在将 WORDML 转换为 TSV 之前,您可以通过 Aspose.Words for Java 从 WORDML 文档中删除未使用的信息。有时您可能需要删除未使用或重复的信息以减少输出文档的大小和处理时间。 CleanupOptions 类允许您指定文档清理的选项。要从文档中删除重复的样式或仅未使用的样式或列表,您可以使用 Cleanup 方法。您可以使用 UnusedStyles 和 UnusedBuiltinStyles 属性来检测和删除标记为“未使用”的样式。
通过 Java 将 TSV 文件保存到流
将 WORDML 转换为 TSV 后, Aspose.Cells for Java 使您能够将文档保存为流式传输。如果您需要将文件保存到 Stream 那么您应该创建一个 FileOutputStream 对象,然后 save 通过调用 Workbook 的 save 方法将文件保存到该 Stream 对象目的。
主要用例
从基于Word的日志或报告中导出表格以进行数据库导入。
为Python或R统计工作流程准备Word生成的数据集。
将来自Word的结构化内容迁移到CRM或ERP环境中。
将格式化表格转换为TSV,用于干净的AI模型训练输入。
自动化场景
将Word报告定期转换为TSV,用于分析仪表板。
基于触发器的TSV导出,用于机器学习数据预处理管道。
从Word模板批处理TSV数据,用于ETL操作。
集成到自动化的大数据工作流程中,用于报告或可视化。