該軟件庫為 Java 開發人員提供了一組函數來將文件 HTML 拆分為多個部分。將 HTML 拆分為單獨的文件可用於更輕鬆地並行處理文檔的各個部分。例如,如果幾個人同時在一個 HTML 上工作,那麼拆分 HTML 可以讓他們加快工作速度。拆分 HTML 可能是從文件 HTML 中提取文本並將數據集成到自動化信息系統或數據庫中的技術的一部分。
我們的庫為 Java 開發人員提供了將 HTML 拆分為多個部分並根據指定模式提取頁面所需的所有功能。這是一個獨立的 Java 解決方案,不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。
使用 Java 代碼中的不同標準拆分 HTML 內容。您可以對 HTML 文件使用以下頁面提取模式:"按標題拆分"、"按節拆分"、"按頁拆分"、"按頁面範圍拆分"。
將文件 HTML 為多個部分後,您可以使用 'Document.Save' 方法將結果導出為所需的文件格式。您還可以使用 'DocumentPartSavingCallback' 屬性控制 HTML 部分如何導出到 HTML 或 EPUB,這將允許您重定向輸出流。
使用我們的 Java 解決方案輕鬆拆分文檔 HTML Java 。以下示例顯示如何使用 Java 拆分 HTML Java:
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>ver</version>
<classifier>jdk17</classifier>
</dependency>
複製
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
複製
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
<artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
複製
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
複製
import com.aspose.words.*;
Document doc = new Document("Input.html");
for (int page = 0; page < doc.getPageCount(); page++)
{
Document extractedPage = doc.extractPages(page, 1);
extractedPage.save(String.format("Output_%d.html", page + 1));
}
我們在Maven存儲庫中託管我們的 Java 'Aspose.Words for Java' 是一個常見的包含字節碼的 JAR 請按照有關如何將其安裝到 Java 開發人員環境的分步說明進行操作。
Java SE 7 和更新的 Java 版本。 Java SE 6 提供了一個單獨的包,以防您不得不使用這個過時的 JRE 。
我們的 Java 包是跨平台的,可以在所有具有 JVM 實現的 Microsoft Windows 、Linux、macOS、Android 和 iOS。
有關可選包依賴項的信息,例如 JogAmp JOGL 、 Harfbuzz 字體引擎、 Java Advanced Imaging JAI ,請參閱產品文檔。