通过 Java 将 DOCM 转换为 DIF 或在线应用程序

无需使用 Microsoft® Word 或 Microsoft® Excel 即可将 DOCM 转换为 DIF 的 On Premise Java API

 

通过 Aspose.Total for Java 将 DOCM 转换为 DIF 是一个简单的两步过程。通过使用功能丰富的文档操作和转换 API Aspose.Words for Java ,您可以将 DOCM 导出为 HTML。之后,通过使用 Aspose.Cells for Java ,您可以将 HTML 转换为 DIF。

将 DOCM 转换为 DIF 的 Java API

  1. 使用 Document 类打开 DOCM 文件
  2. 使用 [Save]( https://reference.aspose.com/words/java/com.aspose.words/Document#save(java.lang.String,com.aspose.words.SaveOptions) 将 DOCM 转换为 HTML ) 方法
  3. 使用 Workbook 类加载 HTML 文档
  4. 使用 Save 方法

转换要求

从您可以直接从基于 Maven 的项目轻松地使用 Aspose.Total for Java 并在您的 pom.xml 中包含库。

或者,您可以从 下载 获取 ZIP 文件。

免费的 DOCM 到 DIF 在线转换器

通过 Java 从 DOCM 文档中删除未使用的信息

Document 在将 DOCM 转换为 DIF 之前,您可以通过 Aspose.Words for Java 从 DOCM 文档中删除未使用的信息。有时您可能需要删除未使用或重复的信息以减少输出文档的大小和处理时间。 CleanupOptions 类允许您指定文档清理的选项。要从文档中删除重复的样式或仅未使用的样式或列表,您可以使用 Cleanup 方法。您可以使用 UnusedStylesUnusedBuiltinStyles 属性来检测和删除标记为“未使用”的样式。

通过 Java 将 DIF 文件保存到流

将 DOCM 转换为 DIF 后, Aspose.Cells for Java 使您能够将文档保存为流式传输。如果您需要将文件保存到 Stream 那么您应该创建一个 FileOutputStream 对象,然后 save 通过调用 Workbook 的 save 方法将文件保存到该 Stream 对象目的。

## 将 **DOCM(Word宏启用文档)** 转换为 **DIF(数据交换格式)** 在将现代Word文件中的表格数据移动到 **与传统兼容的电子表格和统计系统** 中起着重要作用。虽然DOCM文件存储带有宏和格式的结构化信息,但DIF提供了一种纯文本、广泛支持的结构,可以在几十年后仍然可读。这种转换确保了 **数据可移植性、合规性和长期可访问性** ——特别是在受监管的行业、学术研究和仍在使用传统或本地系统的环境中。

主要用例

  • 与旧版电子表格应用程序交换结构化数据
    将DOCM表格转换为DIF,以便与先于CSV/XLSX的传统电子表格程序兼容。

  • 满足长期或受监管平台的合规性要求
    使用DIF满足档案和互操作性要求,其中可能不允许使用现代格式。

  • 为长期可读性准备档案
    将提取的DOCM数据存储在DIF中,以确保几十年后的耐用性和可访问性。

  • 将数据桥接到主机或本地工具
    将基于DOCM的表格数据输入到主机、ERP系统和仍然依赖DIF的安全本地环境中。

  • 支持学术或统计软件包
    实现对仍然接受DIF的传统统计和研究工具的无缝导入。

自动化场景

  • 定期将DOCM转换为DIF的导出
    自动化将Word表格定期导出为DIF,用于合规报告和记录保存。

  • 将遗留集成工作流程中的表格标准化为DIF
    将DOCM中的结构化内容标准化,以供遗留和混合系统下游使用。

  • 用于合规环境的命令行批量转换器
    运行自动化脚本,将多个DOCM文件转换为DIF,适用于安全、受监管的设置。

  • 用于安全网络的空气隔离转换
    使用DIF作为轻量级、脱机兼容格式,在隔离系统中传输结构化数据。

  • 检测表格并生成DIF的文档处理机器人
    部署RPA或基于AI的机器人扫描DOCM文件,提取表格,并输出DIF以进行传统摄入。

使用Java 探索DOCM转换选项

将DOCM转换为EXCEL (电子表格文件格式)