Phân tích tệp DOCX trực tuyến cũng như trích xuất văn bản qua ứng dụng Android
Phát triển ứng dụng tiện ích phân tích tài liệu DOCX dựa trên Android mạnh mẽ. Mã được liệt kê để trích xuất văn bản tài liệu DOCX.
Phân tích tài liệu DOCX trực tuyến
- Nhập tệp DOCX để phân tích bằng cách tải tệp lên.
- Thực hiện việc này bằng cách nhấp vào bên trong khu vực thả bằng cách kéo và thả ứng dụng trình phân tích cú pháp.
- Tùy thuộc vào kích thước của tệp DOCX và tốc độ internet, hãy đợi trong vài giây.
- Nhấp vào nút ‘Phân tích ngay’ để phân tích tài liệu.
- Tải xuống các tệp được phân tích cú pháp để xem ngay lập tức.
Trích xuất văn bản từ tệp DOCX qua ứng dụng Android
- Thêm tham chiếu thư viện vào dự án Java
- Tải tệp DOCX bằng đối tượng lớp Tài liệu
- Xác định các Nút bằng cách sử dụng getLastSection().getChild thuộc loại có liên quan
- Xác định ArrayList bằng cách đăng các nút có liên quan
- Xác định bộ sưu tập và lặp lại để trích xuất thông tin
Mã: Trích xuất văn bản tài liệu DOCX
Document doc = new Document("sourceFile.doc"); | |
Paragraph startPara = (Paragraph) doc.getLastSection().getChild(NodeType.PARAGRAPH, 2, true); | |
Table endTable = (Table) doc.getLastSection().getChild(NodeType.TABLE, 0, true); | |
ArrayList extractedNodes = extractContent(startPara, endTable, true); | |
Collections.reverse(extractedNodes); | |
while (extractedNodes.size() > 0) { | |
endTable.getParentNode().insertAfter((Node) extractedNodes.get(0), endTable); | |
extractedNodes.remove(0); | |
} | |
doc.save("output.doc"); |
Phát triển ứng dụng Android File Parser DOCX
Bạn cần phát triển ứng dụng hoặc phần mềm phân tích cú pháp DOCX? Với
Aspose.Words for Android via Java
, API con của
Aspose.Total for Android via Java
, bất kỳ nhà phát triển Android nào cũng có thể tích hợp mã API trên vào ứng dụng phân tích cú pháp tài liệu của mình. Thư viện android mạnh mẽ cho phép lập trình bất kỳ giải pháp phân tích tài liệu nào để trích xuất hình ảnh cũng như văn bản. Hơn nữa, nó có thể hỗ trợ nhiều định dạng phổ biến bao gồm định dạng DOCX.
Tiện ích Android xử lý tệp DOCX cho ứng dụng phân tích cú pháp
- Chúng tôi lưu trữ các gói Java của mình trong Kho lưu trữ Maven .
- Aspose.Words for Java là một tệp JAR phổ biến chứa mã byte.
- Làm theo hướng dẫn từng bước một về cách cài đặt Aspose.Words for Android via Java.
yêu cầu hệ thống
- Java SE 7 và các phiên bản Java mới hơn được hỗ trợ.
- Gói riêng cho Java SE 6 trong trường hợp một gói bắt buộc phải sử dụng JRE đã lỗi thời.
- Gói Java đa nền tảng và chạy trên tất cả các hệ điều hành có triển khai JVM.
- Các hệ điều hành bao gồm Microsoft Windows, Linux, macOS, Android và iOS.
Để biết thêm chi tiết về các gói phụ thuộc tùy chọn, chẳng hạn như JogAmp JOGL, công cụ phông chữ Harfbuzz, JAI hình ảnh nâng cao Java, vui lòng tham khảo [Tài liệu sản phẩm](https://docs.aspose.com/words/java/system-requirements/).