如何在 Aspose.HTML for Java 中合并 HTML

Aspose.HTML for Java 中的合并 HTML 是将多个 HTML 文档按顺序渲染到一个输出文件中。每个 HTML 文档都是独立处理的,并按顺序渲染到同一输出设备(PDF、DOCX、XPS 或图像格式)中。


在线 HTML 合并器

在线 HTML 合并器可让你在浏览器中将多个 HTML 文件实时合并为一个文档。请从本地文件系统或 URL 加载 HTML 文件,选择所需的输出格式并运行示例!它快速、简单、安全,而且完全免费!您将立即得到一个单独文件的结果。因此,您可以在线快速合并 HTML 文件并将结果保存为 PDF、XPS、DOCX、TIFF 或 MHTML 格式!

用 Java 合并 HTML 文件的步骤

如果您想以编程方式合并 HTML,请参阅上面的示例。Aspose.HTML for Java 使用渲染管道处理多个 HTML 文档:

  1. 使用 HTMLDocument 加载 HTML 文件。每个 HTML 文件都作为单独的文档加载,并解析为自己的 DOM。所有资源(如样式、图像和字体)都是独立解析的,因此每个文档在此阶段都是完全独立的。
  2. 创建 HtmlRenderer。渲染器初始化负责将 DOM 树转换为可视化输出的处理引擎。它控制渲染,但不会合并或修改文档结构。
  3. 选择输出设备(PDF、DOCX、XPS、Image)。输出设备定义目标格式并控制渲染内容的序列化方式。
  4. render()传递多个文档。所有文档都会按顺序处理。每个 DOM 会被独立渲染,渲染后的输出会被写入由选定设备管理的单一连续流中。
  5. 生成一个合并输出文件。最终结果是一个输出文件,所有文档按照输入顺序依次出现。

如何渲染多个 HTML 文档

Aspose.HTML for Java API 提供了用于渲染和合并 HTML 文档的 Renderer 类。直接使用渲染器实例,您可以一次向输出渲染设备发送多个文件。Aspose.HTML for Java 使用渲染流水线模型,其中每个文档都是独立处理并写入共享输出设备的。

  • 支持的渲染器HtmlRendererSvgRendererMhtmlRendererEpubRenderer ,它们分别用于渲染 HTML、SVG、MHTML 和 EPUB 文档。
  • 支持的输出设备:PdfDevice、XpsDevice、DocDevice 和 ImageDevice。每个设备都定义了最终输出格式。

开始使用 Aspose.HTML for Java 库

Aspose.HTML for Java 是一个用于网页抓取和 HTML 解析的高级库。它允许您创建和编辑文件、浏览文件、提取数据,以及将 HTML、XHTML 和 MHTML 文件转换为 PDF、图像和其他格式。此外,它还开箱即用地处理 CSS、HTML Canvas、SVG、XPath 和 JavaScript 以扩展操作任务。它是一个独立的 API,不需要安装任何软件。
您可以直接从 Aspose Maven Repository 下载其最新版本,并通过将以下配置添加到 pom.xml 将其安装到基于 Maven 的项目中。


Repository

<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-html</artifactId>
<version>version of aspose-html API</version>
<classifier>jdk17</classifier>
</dependency>



常见问题

1. Aspose.HTML for Java 中的’合并 HTML’是什么意思?
合并 HTML 是指使用渲染管道将多个 HTML 文档按顺序渲染到一个输出文件中。

2. ‘合并 HTML’是否是一个 DOM 层操作?
不是。HTML 文档不会合并到一个 DOM 中。每个文档都会被独立处理并呈现为共享输出。

3. 我能否控制合并 HTML 文件的顺序?
可以,输入数组中文件的顺序决定了最终的输出顺序。

4. 我能否在合并前修改 HTML?
可以。每个 HTMLDocument 都可以在呈现前使用 DOM API 进行修改。

5. 合并 HTML 时是否保留样式?
是的。每个文档都使用自己的样式进行呈现,但视觉一致性取决于如何在各文档之间定义样式。

6. 合并 HTML 输出支持哪些格式?
合并 HTML 通过渲染设备支持 PDF、DOCX、XPS 以及 PNG、JPEG 和 TIFF 等图像格式。