通过 Aspose.Total for Java 将 DOC 转换为 TSV 是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 DOC 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 TSV。
将 DOC 转换为 TSV 的 Java API
- 使用 Document 类打开 DOC 文件
- 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 DOC 转换为 HTML ) 方法
- 使用 Workbook 类加载 HTML 文档
- 使用 Save 将文档保存为 TSV 格式方法
免费的 DOC 到 TSV 在线转换器
通过 Java 从 DOC 文档中删除未使用的信息
在将 DOC 转换为 TSV 之前,您可以通过 Aspose.Words for Java 从 DOC 文档中删除未使用的信息。有时您可能需要删除未使用或重复的信息以减少输出文档的大小和处理时间。 CleanupOptions 类允许您指定文档清理的选项。要从文档中删除重复的样式或仅未使用的样式或列表,您可以使用 Cleanup 方法。您可以使用 UnusedStyles 和 UnusedBuiltinStyles 属性来检测和删除标记为“未使用”的样式。
通过 Java 将 TSV 文件保存到流
将 DOC 转换为 TSV 后, Aspose.Cells for Java 使您能够将文档保存为流式传输。如果您需要将文件保存到 Stream 那么您应该创建一个 FileOutputStream 对象,然后 save 通过调用 Workbook 的 save 方法将文件保存到该 Stream 对象目的。
```
将 **DOC** 转换为 **TSV(制表符分隔值)** 对于从富文本文档中提取结构化的纯文本数据并将其转换为轻量级表格格式至关重要。TSV 得到数据库、电子表格和分析工具的广泛支持,使其成为数据交换和处理的理想选择。
主要用例
- 将文档表导出为 TSV 以进行数据库导入
- 为分析平台准备数据
- 与 Excel 和 Google Sheets 等电子表格应用集成
- 共享轻量级结构化数据集
自动化场景
- 用于 DOC 到 TSV 表提取的软件
- 用于批处理的自动转换脚本
- 使用制表符生成输出的文档解析
使用Java 探索DOC转换选项
将DOC转换为CSV
(逗号分隔值)
将DOC转换为DIF
(数据交换格式)
将DOC转换为EXCEL
(电子表格文件格式)
将DOC转换为FODS
(OpenDocument 平面 XML 电子表格)
将DOC转换为ODS
(OpenDocument电子表格)
将DOC转换为SXC
(StarSuite Calc 电子表格)
将DOC转换为XLAM
(Excel 启用宏的加载项)
将DOC转换为XLS
(Microsoft Excel 二进制格式)
将DOC转换为XLSB
(Excel 二进制工作簿)
将DOC转换为XLSM
(启用宏的电子表格)
将DOC转换为XLSX
(打开 XML 工作簿)
将DOC转换为XLT
(Excel 97 - 2003 模板)
将DOC转换为XLTM
(Excel 启用宏的模板)
将DOC转换为XLTX
(Excel模板)
将DOC转换为JSON
(JavaScript 对象表示法文件)
将DOC转换为ODP
(OpenDocument 演示文稿格式)
将DOC转换为POT
(Microsoft PowerPoint 模板文件)
将DOC转换为POTM
(Microsoft PowerPoint 模板文件)
将DOC转换为POTX
(Microsoft PowerPoint 模板演示)
将DOC转换为PPTX
(打开 XML 表示格式)
将DOC转换为PPS
(PowerPoint 幻灯片放映)
将DOC转换为PPSM
(启用宏的幻灯片放映)
将DOC转换为PPSX
(PowerPoint 幻灯片放映)
将DOC转换为PPT
(PowerPoint演示文稿)
将DOC转换为PPTM
(启用宏的演示文稿文件)
将DOC转换为PPTX
(打开 XML 表示格式)