將 HTML 拆分為 Java 中的部分

快速 Java 庫,用於根據給定條件將一個 HTML 文件拆分為一組較小的文件。

使用 Java 庫將 HTML 文件拆分為多個部分。您可以將提取的 HTML 頁面與其他數據集成,從而獲得所需形式和內容的文檔。將 HTML 拆分為多個部分可以更輕鬆地協作處理 HTML 文件。

查看代碼片段

使用 Java 拆分 HTML

該軟件庫為 Java 開發人員提供了一組函數來將文件 HTML 拆分為多個部分。將 HTML 拆分為單獨的文件可用於更輕鬆地並行處理文檔的各個部分。例如,如果幾個人同時在一個 HTML 上工作,那麼拆分 HTML 可以讓他們加快工作速度。拆分 HTML 可能是從文件 HTML 中提取文本並將數據集成到自動化信息系統或數據庫中的技術的一部分。

我們的庫為 Java 開發人員提供了將 HTML 拆分為多個部分並根據指定模式提取頁面所需的所有功能。這是一個獨立的 Java 解決方案,不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。

將文件 HTML 拆分為代碼 Java 中的部分

使用 Java 代碼中的不同標準拆分 HTML 內容。您可以對 HTML 文件使用以下頁面提取模式:"按標題拆分"、"按節拆分"、"按頁拆分"、"按頁面範圍拆分"。

將文件 HTML 為多個部分後,您可以使用 'Document.Save' 方法將結果導出為所需的文件格式。您還可以使用 'DocumentPartSavingCallback' 屬性控制 HTML 部分如何導出到 HTML 或 EPUB,這將允許您重定向輸出流。

使用我們的 Java 解決方案輕鬆拆分文檔 HTML Java 。以下示例顯示如何使用 Java 拆分 HTML Java:

Java 用於拆分 HTML 文件的代碼示例
上傳要拆分的文件
運行代碼
從列表中選擇目標格式
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>
複製
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
複製
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
複製
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
複製
import com.aspose.words.*;

Document doc = new Document("Input.html");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.html", page + 1));
}
運行代碼

如何將 HTML 拆分為 Java

  1. 安裝 Java 庫以編程方式拆分 HTML 文件。
  2. 將庫引用(導入庫)添加到您的 Java 項目。
  3. 在 Java 中打開 HTML。
  4. 調用extractPages()方法從 HTML 中提取特定頁面。
  5. 獲取 HTML 拆分為單獨文件的結果。

Java 個庫來拆分 HTML 個文檔

我們在Maven存儲庫中託管我們的 Java 'Aspose.Words for Java' 是一個常見的包含字節碼的 JAR 請按照有關如何將其安裝到 Java 開發人員環境的分步說明進行操作。

系統要求

Java SE 7 和更新的 Java 版本。 Java SE 6 提供了一個單獨的包,以防您不得不使用這個過時的 JRE 。

我們的 Java 包是跨平台的,可以在所有具有 JVM 實現的 Microsoft Windows 、Linux、macOS、Android 和 iOS。

有關可選包依賴項的信息,例如 JogAmp JOGL 、 Harfbuzz 字體引擎、 Java Advanced Imaging JAI ,請參閱產品文檔

其他支持的 HTML 拆分操作

您還可以將 HTML 拆分為其他文件格式:

5%

訂閱 Aspose 產品更新

獲取直接發送到您的郵箱的每月通訊和優惠。

© Aspose Pty Ltd 2001-2024. 版權所有。