通过 Java 进行 HTML 转换

将 HTML 转换为 PDF、XPS 和图像,包括 JPG、BMP、PNG、TIFF,以构建跨平台的 Java 应用程序。

如何使用 Java 库转换 HTML

每当需要将 HTML 文件以及网页从实时 URL 批量转换为其他格式(包括 PDF、XPS、图像和其他格式)时,Java HTML Parser API 可以处理所有此类情况。 API提供 HTMLDocument 加载文档,保存选项类如 PdfSaveOptions , ImageSaveOptions 等目标文件特定设置和 转换器类 用于渲染到输出文件。


HTML 到 PDF 转换

对于以编程方式将单个或多个 HTML 文件转换为 PDF,过程是,使用 HtmlDocument 类加载源 HTML 文件,对于页面大小、边距、文件权限、CSS 媒体类型等特定 PDF 设置,使用 PdfSaveOptions 类,最后调用具有 HTMLDocument、PdfSaveOptions 和输出文件路径作为参数的 Converter 类的 ConvertHTML() 方法。

HTML 到 PDF 转换的 Java 代码

// Initialize an HTML document from html file
HTMLDocument htmltoPdf = new HTMLDocument("sourceFile.html");
try {
    // Initialize PdfSaveOptions
    PdfSaveOptions pdfOpts = new PdfSaveOptions();

    // Convert HTML to PDF
    Converter.convertHTML(
            htmltoPdf,
            pdfOpts,
            "output.pdf"
    );
} finally {
    if (htmltoPdf != null) {
        htmltoPdf.dispose();
    }
}



将 HTML 转换为图像

Java html 解析器 API 为读取、提取和操作 HTML 数据而构建,可以轻松地将 HTML 数据呈现为图像格式。创建 API ImageSaveOptions 类对象,为所有特定设置提供方法,如 setCompression、setFormat、setHorizo​​ntalResolution、setSmoothingMode、setVerticalResolution 等. 最后使用Converter.convertHTML 方法进行转换,将HTMLDocument 对象、图像选项和目标图像作为参数。

将 HTML 转换为图像格式的 Java 代码

// Initialize an HTML document from a file
HTMLDocument htmltoImages = new HTMLDocument("document.html");
try {
    // Initialize ImageSaveOptions having image format and format can be Png, Jpeg, Bmp, Gif, Tiff
    ImageSaveOptions imgOptions = new ImageSaveOptions(ImageFormat.Png);

    // Convert HTML to PNG
    Converter.convertHTML(htmltoImages, imgOptions, "output.png");
} finally {
    if (htmltoImages != null) {
        htmltoImages.dispose();
    }
}



Aspose.Html.Converters 包实现了对转换方法的轻松访问。它提供了广泛的 HTML 到流行格式的转换,例如 PDF、XPS、JPEG、PNG、BMP、TIFF、GIF、MHTML 和 MD。请访问文档章节 Converting Between Formats 以了解有关 Aspose.HTML for Java API 转换功能的更多信息。

其他支持的转换

您还可以将 HTML、XHTML、MHTML、EPUB、Markdown 和 SVG 文件转换为许多其他文件格式,包括下面列出的几种: