通过在线应用程序解析 DOCX 文档
- 通过上传导入DOCX文件进行解析。
- 通过拖放解析器应用程序在放置区域内单击来完成此操作。
- 根据 DOCX 文件的大小和互联网速度,等待几秒钟。
- 单击“立即解析”按钮来解析文档。
- 下载解析的文件以立即查看。
通过 Java 从 DOCX 文件中提取文本
- 添加库引用到Java项目
- 使用 Document 类对象加载 DOCX 文件
- 使用相关类型的 getLastSection().getChild 定义节点
- 通过发布相关节点来定义ArrayList
- 定义集合并迭代以提取信息
提取DOCX文档文本的Java代码
Document doc = new Document("sourceFile.doc"); | |
Paragraph startPara = (Paragraph) doc.getLastSection().getChild(NodeType.PARAGRAPH, 2, true); | |
Table endTable = (Table) doc.getLastSection().getChild(NodeType.TABLE, 0, true); | |
ArrayList extractedNodes = extractContent(startPara, endTable, true); | |
Collections.reverse(extractedNodes); | |
while (extractedNodes.size() > 0) { | |
endTable.getParentNode().insertAfter((Node) extractedNodes.get(0), endTable); | |
extractedNodes.remove(0); | |
} | |
doc.save("output.doc"); |
通过 Java 开发 DOCX 文件解析器应用程序
需要开发 DOCX 解析器应用程序或软件?通过
Aspose.Words for Java
(
Aspose.Total for Java
的子 API),任何 Java 开发人员都可以将上述 API 代码集成到其文档解析器应用程序中。强大的 Java 库允许对任何文档解析解决方案进行编程以提取图像和文本。而且它可以支持包括DOCX格式在内的多种流行格式。
用于为解析器应用程序处理 DOCX 文件的 Java 实用程序
还有其他选项可以将“
Aspose.Words for Java
”或“
Aspose.Total for Java
”安装到您的系统上。我们的 Java 包被设计为跨平台的,与 Microsoft Windows、Linux、macOS、Android 和 iOS 等各种操作系统上的 JVM 实现兼容。请选择符合您需求的一项并按照分步说明进行操作:
- 安装 Aspose.Words for Java
- 或者来自 Maven
- 一步一步 指示
系统要求
- Java SE 7 或最新的 Java 版本
- Java SE 6 的单独包以防您有这个过时的 JRE。
有关 JogAmp JOGL、Harfbuzz 字体引擎和 Java Advanced Imaging JAI 的详细信息请参阅 [产品文档](https://docs.aspose.com/words/java/system-requirements/#optional-dependencies)。
常见问题解答
- 我可以在我的应用程序中使用上述 Java 代码吗?是的,欢迎您下载此代码并使用它来开发基于 Java 的文档解析器应用程序。此代码可以作为宝贵的资源来增强项目在后端文档处理领域的功能和能力,例如读取节点和加载文档以进行文本和图像提取。
- 这个在线文档解析器应用程序只能在 Windows 上运行吗?您可以灵活地在任何设备上启动文档解析,无论其运行的操作系统是 Windows、Linux、Mac OS 还是 Android。所需要的只是一个现代的网络浏览器和一个活跃的互联网连接。
- 使用在线应用程序解析 DOCX 文档安全吗?当然!通过我们的服务生成的输出文件将在 24 小时内安全地自动从我们的服务器中删除。因此,与这些文件关联的显示链接将在此期限后停止运行。
- App应该用什么浏览器?您可以使用任何现代 Web 浏览器(例如 Google Chrome、Firefox、Opera 或 Safari)作为在线 DOCX 文档解析器。但是,如果您正在开发桌面应用程序,我们建议使用 Aspose.Total 文档处理 API 进行高效管理。