将 HTML 拆分为 Java 中的部分

快速 Java 库,用于根据给定条件将一个 HTML 文件拆分为一组较小的文件。

使用 Java 库将 HTML 文件拆分为多个部分。您可以将提取的 HTML 页面与其他数据集成,从而获得所需形式和内容的文档。将 HTML 拆分为多个部分可以更轻松地协作处理 HTML 文件。

查看代码片段

使用 Java 拆分 HTML

该软件库为 Java 开发人员提供了一组函数来将文件 HTML 拆分为多个部分。将 HTML 拆分为单独的文件可用于更轻松地并行处理文档的各个部分。例如,如果几个人同时在一个 HTML 上工作,那么拆分 HTML 可以让他们加快工作速度。拆分 HTML 可能是从文件 HTML 中提取文本并将数据集成到自动化信息系统或数据库中的技术的一部分。

我们的库为 Java 开发人员提供了将 HTML 拆分为多个部分并根据指定模式提取页面所需的所有功能。这是一个独立的 Java 解决方案,不需要安装 Microsoft Word、Acrobat Reader 或其他应用程序。

将文件 HTML 拆分为代码 Java 中的部分

使用 Java 代码中的不同标准拆分 HTML 内容。您可以对 HTML 文件使用以下页面提取模式:"按标题拆分"、"按节拆分"、"按页拆分"、"按页面范围拆分"。

将文件 HTML 为多个部分后,您可以使用 'Document.Save' 方法将结果导出为所需的文件格式。您还可以使用 'DocumentPartSavingCallback' 属性控制 HTML 部分如何导出到 HTML 或 EPUB,这将允许您重定向输出流。

使用我们的 Java 解决方案轻松拆分文档 HTML Java 。以下示例显示如何使用 Java 拆分 HTML Java:

Java 用于拆分 HTML 文件的代码示例
上传要拆分的文件
运行代码
从列表中选择目标格式
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>
复制
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
复制
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
复制
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
复制
import com.aspose.words.*;

Document doc = new Document("Input.html");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.html", page + 1));
}
运行代码

如何将 HTML 拆分为 Java

  1. 安装 Java 库以编程方式拆分 HTML 文件。
  2. 将库引用(导入库)添加到您的 Java 项目。
  3. 在 Java 中打开 HTML。
  4. 调用extractPages()方法从 HTML 中提取特定页面。
  5. 获取 HTML 拆分为单独文件的结果。

用于拆分 HTML 个文档的 Java 个库

我们在Maven存储库中托管我们的 Java 'Aspose.Words for Java' 是一个常见的包含字节码的 JAR 请按照有关如何将其安装到 Java 开发人员环境的分步说明进行操作。

系统要求

Java SE 7 和更新的 Java 版本。 Java SE 6 提供了一个单独的包,以防您不得不使用这个过时的 JRE 。

我们的 Java 包是跨平台的,可以在所有具有 JVM 实现的 Microsoft Windows 、Linux、macOS、Android 和 iOS。

有关可选包依赖项的信息,例如 JogAmp JOGL 、 Harfbuzz 字体引擎、 Java Advanced Imaging JAI ,请参阅产品文档

其他支持的 HTML 拆分操作

您还可以将 HTML 拆分为其他文件格式:

5%

订阅 Aspose 产品更新

获取直接发送到您的邮箱的每月通讯和优惠。

© Aspose Pty Ltd 2001-2024. 版权所有。