通过 Java 进行 HTML 转换
将 HTML 转换为 PDF、XPS 和图像,包括 JPG、BMP、PNG、TIFF,以构建跨平台的 Java 应用程序。
如何使用 Java 库转换 HTML
每当需要将 HTML 文件以及网页从实时 URL 批量转换为其他格式(包括 PDF、XPS、图像和其他格式)时,Java HTML Parser API 可以处理所有此类情况。 API提供 HTMLDocument 加载文档,保存选项类如 PdfSaveOptions , ImageSaveOptions 等目标文件特定设置和 转换器类 用于渲染到输出文件。
HTML 到 PDF 转换
对于以编程方式将单个或多个 HTML 文件转换为 PDF,过程是,使用 HtmlDocument 类加载源 HTML 文件,对于页面大小、边距、文件权限、CSS 媒体类型等特定 PDF 设置,使用 PdfSaveOptions 类,最后调用具有 HTMLDocument、PdfSaveOptions 和输出文件路径作为参数的 Converter 类的 ConvertHTML() 方法。
HTML 到 PDF 转换的 Java 代码
// Initialize an HTML document from html file
HTMLDocument htmltoPdf = new HTMLDocument("sourceFile.html");
try {
// Initialize PdfSaveOptions
PdfSaveOptions pdfOpts = new PdfSaveOptions();
// Convert HTML to PDF
Converter.convertHTML(
htmltoPdf,
pdfOpts,
"output.pdf"
);
} finally {
if (htmltoPdf != null) {
htmltoPdf.dispose();
}
}
将 HTML 转换为图像
Java html 解析器 API 为读取、提取和操作 HTML 数据而构建,可以轻松地将 HTML 数据呈现为图像格式。创建 API ImageSaveOptions 类对象,为所有特定设置提供方法,如 setCompression、setFormat、setHorizontalResolution、setSmoothingMode、setVerticalResolution 等. 最后使用Converter.convertHTML 方法进行转换,将HTMLDocument 对象、图像选项和目标图像作为参数。
将 HTML 转换为图像格式的 Java 代码
// Initialize an HTML document from a file
HTMLDocument htmltoImages = new HTMLDocument("document.html");
try {
// Initialize ImageSaveOptions having image format and format can be Png, Jpeg, Bmp, Gif, Tiff
ImageSaveOptions imgOptions = new ImageSaveOptions(ImageFormat.Png);
// Convert HTML to PNG
Converter.convertHTML(htmltoImages, imgOptions, "output.png");
} finally {
if (htmltoImages != null) {
htmltoImages.dispose();
}
}
Aspose.Html.Converters 包实现了对转换方法的轻松访问。它提供了广泛的 HTML 到流行格式的转换,例如 PDF、XPS、JPEG、PNG、BMP、TIFF、GIF、MHTML 和 MD。请访问文档章节 Converting Between Formats 以了解有关 Aspose.HTML for Java API 转换功能的更多信息。
其他支持的转换
您还可以将 HTML、XHTML、MHTML、EPUB、Markdown 和 SVG 文件转换为许多其他文件格式,包括下面列出的几种: