Sử dụng thư viện Java để chia HTML tệp thành nhiều phần. Bạn có thể tích hợp các trang HTML được trích xuất với dữ liệu khác và kết quả là bạn nhận được các tài liệu có dạng và nội dung mà bạn yêu cầu. Việc chia nhỏ HTML thành các phần giúp cộng tác trên các HTML tệp dễ dàng hơn.
Thư viện phần mềm này cung cấp cho các nhà phát triển Java một bộ chức năng để chia HTML tệp thành nhiều phần. Chia HTML thành các tệp riêng biệt có thể được sử dụng để giúp làm việc song song với các phần của tài liệu dễ dàng hơn. Ví dụ: nếu nhiều người đang làm việc trên một HTML cùng một lúc, thì việc tách HTML sẽ cho phép họ tăng tốc công việc. Việc phân tách HTML có thể là một phần của công nghệ trích xuất văn bản từ HTML tệp và tích hợp dữ liệu vào cơ sở dữ liệu hoặc hệ thống thông tin tự động.
Thư viện của chúng tôi cung cấp cho các nhà phát triển Java tất cả các chức năng cần thiết để chia HTML thành các phần và trích xuất các trang theo chế độ được chỉ định. Đây là giải pháp Java độc lập không cần cài đặt Microsoft Word, Acrobat Reader hoặc các ứng dụng khác.
Nội dung Split HTML sử dụng các tiêu chí khác nhau trong mã Java. Bạn có thể sử dụng các chế độ trích xuất trang sau cho các HTML tệp: 'chia theo tiêu đề', 'chia theo phần', 'chia trang theo trang', 'chia theo phạm vi trang'.
Sau khi chia HTML tệp của bạn thành các phần, bạn có thể xuất kết quả sang định dạng tệp được yêu cầu bằng phương pháp 'Document.Save'. Bạn cũng có thể kiểm soát cách phần HTML được xuất sang HTML hoặc EPUB bằng cách sử dụng thuộc tính 'DocumentPartSavingCallback', điều này sẽ cho phép bạn chuyển hướng các luồng đầu ra.
Tách HTML tài liệu dễ dàng với giải pháp của chúng tôi cho Java. Ví dụ sau cho thấy cách tách HTML bằng Java:
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>ver</version>
<classifier>jdk17</classifier>
</dependency>
Sao chép
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
Sao chép
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
<artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
Sao chép
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
Sao chép
import com.aspose.words.*;
Document doc = new Document("Input.html");
for (int page = 0; page < doc.getPageCount(); page++)
{
Document extractedPage = doc.extractPages(page, 1);
extractedPage.save(String.format("Output_%d.html", page + 1));
}
Chúng tôi lưu trữ các gói Java trong kho Maven. 'Aspose.Words dành cho Java' là một JAR phổ biến chứa mã byte. Vui lòng làm theo hướng dẫn từng bước về cách cài đặt nó vào môi trường nhà phát triển Java của bạn.
Java SE 7 và Java phiên bản Java mới hơn được hỗ trợ. Chúng tôi cũng cung cấp một gói riêng cho Java SE 6 trong trường hợp bạn bắt buộc phải sử dụng JRE lỗi thời này.
Java của chúng tôi đa nền tảng và chạy trên tất cả các hệ điều hành có JVM, bao gồm Microsoft Windows, Linux, macOS, Android và iOS.
Để biết thông tin về các gói phụ thuộc tùy chọn, chẳng hạn như JogAmp JOGL, công cụ phông chữ Harfbuzz Java Advanced Imaging JAI, vui lòng tham khảo Tài liệu sản phẩm.