Conversión de HTML a través de Java

Convierta HTML a PDF, XPS e imágenes, incluidos JPG, BMP, PNG, TIFF para crear aplicaciones Java multiplataforma.

Cómo convertir HTML usando la biblioteca de Java

Siempre que sea necesario convertir por lotes archivos HTML, así como páginas web desde la URL activa a otros formatos, incluidos PDF, XPS, imágenes y otros formatos, Java HTML Parser API está ahí para manejar todos esos casos. La API proporciona HTMLDocument para cargar el documento, guardar clases de opciones como PdfSaveOptions , ImageSaveOptions etc. para el objetivo configuración específica del archivo y una clase de convertidor para renderizar en el archivo de salida.


Conversión de HTML a PDF

Para la conversión de uno o varios archivos HTML a PDF mediante programación, el proceso consiste en cargar el archivo HTML de origen usando la clase HtmlDocument, para configuraciones específicas de PDF como tamaño de página, márgenes, permisos de archivo, tipo de medio CSS, etc., use la clase PdfSaveOptions y, por último, llame el método ConvertHTML() de la clase Converter que tiene HTMLDocument, PdfSaveOptions y la ruta del archivo de salida como parámetros.

Código Java para la conversión de HTML a PDF

// Initialize an HTML document from html file
HTMLDocument htmltoPdf = new HTMLDocument("sourceFile.html");
try {
    // Initialize PdfSaveOptions
    PdfSaveOptions pdfOpts = new PdfSaveOptions();

    // Convert HTML to PDF
    Converter.convertHTML(
            htmltoPdf,
            pdfOpts,
            "output.pdf"
    );
} finally {
    if (htmltoPdf != null) {
        htmltoPdf.dispose();
    }
}



Convertir HTML a Imágenes

API de analizador HTML de Java creada para leer, extraer y manipular datos HTML, puede convertir datos HTML en formatos de imagen fácilmente. Cree un objeto de clase API ImageSaveOptions que proporciona métodos para todas las configuraciones específicas como setCompression, setFormat, setHorizontalResolution, setSmoothingMode, setVerticalResolution, etc. Y finalmente use el método Converter.convertHTML para la conversión, teniendo el objeto HTMLDocument, las opciones de imagen y la imagen de destino como parámetros.

Código Java para convertir HTML a formatos de imagen

// Initialize an HTML document from a file
HTMLDocument htmltoImages = new HTMLDocument("document.html");
try {
    // Initialize ImageSaveOptions having image format and format can be Png, Jpeg, Bmp, Gif, Tiff
    ImageSaveOptions imgOptions = new ImageSaveOptions(ImageFormat.Png);

    // Convert HTML to PNG
    Converter.convertHTML(htmltoImages, imgOptions, "output.png");
} finally {
    if (htmltoImages != null) {
        htmltoImages.dispose();
    }
}



El paquete Aspose.Html.Converters implementa un fácil acceso a los métodos de conversión. Proporciona una amplia gama de conversiones de HTML a formatos populares, como PDF, XPS, JPEG, PNG, BMP, TIFF, GIF, MHTML y MD. Visite el capítulo de documentación Conversión entre formatos para obtener más información sobre las funciones de conversión de Aspose.HTML para la API de Java.

Otras conversiones admitidas

También puede convertir archivos HTML, XHTML, MHTML, EPUB, Markdown y SVG a muchos otros formatos de archivo, incluidos algunos de los que se enumeran a continuación: