Aspose.HTML for Java 是一种高级 HTML 操作 API,用于在 Java 应用程序中操作和生成 HTML。 API 允许添加、删除、替换节点、提取 CSS 以及通过多种方式浏览文档。此外,API 提供了加载 EPUB 和 MHTML 的能力,并提供了允许通过 JavaScript 操作 DOM 的脚本。
Aspose.HTML for Java 支持文件间格式转换以加载 HTML 文档并以 XPS、PDF 和光栅图像(包括 JPEG、PNG、BMP 等)保存输出,并为 PDF 文件提供加密。
高级 Java HTML 处理 API 特性
从头开始创建 HTML 页面
加载现有文件
实施 W3C 规范
轻量级和独立的组件
插入、替换或删除节点
提取 CSS 样式信息
加载 EPUB 和 MHTML 文档格式
将 HTML 呈现为光栅图像
文档中的 API 功能
您可以在我们的文档中查看 Aspose.HTML 功能的完整列表。在您的项目中使用 Aspose.HTML for Java 库允许您执行以下任务:
- 创建或打开来自不同来源的现有 HTML 文档(示例项目中的 Aspose.HTML.Examples.QuickStart.DocumentOpenTests)。
- HTML 操作:通过 API 创建、编辑、删除和替换 HTML 节点。
- 保存 HTML 文档。
- 为特定的 HTML 节点提取 CSS 样式。
- 配置影响 HTML 文档处理的文档沙箱。
- 以不同方式浏览 HTML 文档。
- 将 HTML 文档转换为各种支持的格式:JPEG、PNG、BMP、TIFF、PDF、XPS 等。
将 HTML 转换为 PDF 和 XPS 格式
API 支持将 HTML 渲染为最常用的光栅图像,包括 BMP、TIFF、JPEG、PNG、PDF 和 XPS 格式。开发人员可以通过为生成的固定布局格式配置 PageSetup 方面进行自定义,包括要呈现的页码、生成的页面大小或为嵌入图像设置 JPEG 压缩。
将 HTML 呈现为固定布局格式 – Java
// Load a file to be rendered
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");
// Render HTML to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();
renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);
您可以尝试在线 HTML 转换器。
您还可以将 HTML、XHTML、MHTML、Markdown、EPUB 或 SVG 转换为许多其他文件格式,包括下面列出的几种:
转换为光栅图像
Aspose.HTML for Java 在其核心提供高保真渲染引擎,可以将 HTML 页面转换为最常用的光栅图像格式,包括 TIFF、BMP、PNG 和 JPEG,而无需任何额外的软件或工具。
处理 EPUB 和 MHTML 文件
该库能够加载 EPUB 和 MHTML 文件以执行各种操作,包括转换为固定布局和光栅图像格式。
HTML 节点导航
API 支持通过 XPath、元素或 CSS 选择器查询在 HTML 文件中导航,并且可以轻松地插入、提取、删除或替换节点。
提取锚点类型的所有节点 – Java
// instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");
// get all anchor type nodes
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");
// display anchor text & href values for all nodes
for (Node node : nodelist){
HTMLAnchorElement anchor = (HTMLAnchorElement)node;
System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}
配置沙盒
HTML API 使您能够配置影响 HTML 文档处理的文档沙箱,即;在某些情况下,CSS 样式取决于屏幕尺寸。