Aspose.HTML for Java 是一种高级 HTML 操作 API,用于在 Java 应用程序中操作和生成 HTML。 API 允许添加、删除、替换节点、提取 CSS 以及通过多种方式浏览文档。此外,API 提供了加载 EPUB 和 MHTML 的能力,并提供了允许通过 JavaScript 操作 DOM 的脚本。
Aspose.HTML for Java 支持文件间格式转换以加载 HTML 文档并以 XPS、PDF 和光栅图像(包括 JPEG、PNG、BMP 等)保存输出,并为 PDF 文件提供加密。
高级 Java HTML 处理 API 特性
new 从网站提取图像
new 从 URL 保存文件
new 从网站提取 SVG
从头开始创建 HTML 页面
加载现有文件
实施 W3C 规范
插入、替换或删除节点
提取 CSS 样式信息
加载 EPUB 和 MHTML 文档格式
将 HTML 呈现为光栅图像
文档中的 API 功能
您可以在我们的文档中查看 Aspose.HTML 功能的完整列表。在您的项目中使用 Aspose.HTML for Java 库允许您执行以下任务:
- 创建或打开来自不同来源的现有 HTML 文档(示例项目中的 Aspose.HTML.Examples.QuickStart.DocumentOpenTests)。
- HTML 操作:通过 API 创建、编辑、删除和替换 HTML 节点。
- 保存 HTML 文档。
- 为特定的 HTML 节点提取 CSS 样式。
- 配置影响 HTML 文档处理的文档沙箱。
- 以不同方式浏览 HTML 文档。
- 将 HTML 文档转换为各种支持的格式:JPEG、PNG、BMP、TIFF、PDF、XPS 等。
将 HTML 转换为 PDF 和 XPS 格式
API 支持将 HTML 渲染为最常用的光栅图像,包括 BMP、TIFF、JPEG、PNG、PDF 和 XPS 格式。开发人员可以通过为生成的固定布局格式配置 PageSetup 方面进行自定义,包括要呈现的页码、生成的页面大小或为嵌入图像设置 JPEG 压缩。
将 HTML 呈现为固定布局格式 – Java
// Load a file to be rendered
HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");
// Render HTML to PDF & XPS
HtmlRenderer renderer = new HtmlRenderer();
renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);
您可以尝试在线 HTML 转换器。
您还可以将 HTML、XHTML、MHTML、Markdown、EPUB 或 SVG 转换为许多其他文件格式,包括下面列出的几种:
转换为光栅图像
Aspose.HTML for Java 在其核心提供高保真渲染引擎,可以将 HTML 页面转换为最常用的光栅图像格式,包括 TIFF、BMP、PNG 和 JPEG,而无需任何额外的软件或工具。
处理 EPUB 和 MHTML 文件
该库能够加载 EPUB 和 MHTML 文件以执行各种操作,包括转换为固定布局和光栅图像格式。
HTML 节点导航
API 支持通过 XPath、元素或 CSS 选择器查询在 HTML 文件中导航,并且可以轻松地插入、提取、删除或替换节点。
提取锚点类型的所有节点 – Java
// instance creation of HTMLDocument and loading HTML from URL
HTMLDocument dct = new HTMLDocument("https://www.aspose.com");
// get all anchor type nodes
NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");
// display anchor text & href values for all nodes
for (Node node : nodelist){
HTMLAnchorElement anchor = (HTMLAnchorElement)node;
System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
}
配置沙盒
HTML API 使您能够配置影响 HTML 文档处理的文档沙箱,即;在某些情况下,CSS 样式取决于屏幕尺寸。