Aspose.HTML para Java es una API avanzada de manipulación de HTML para manipular y generar HTML dentro de las aplicaciones Java. La API permite agregar, eliminar, reemplazar nodos, extraer CSS y navegar a través de un documento de múltiples maneras. Además, la API brinda la capacidad de cargar EPUB y MHTML, así como también ofrece secuencias de comandos que permiten manipular DOM a través de JavaScript.
Aspose.HTML para Java admite la conversión de formato entre archivos para cargar documentos HTML y guardar la salida en XPS, PDF e imágenes rasterizadas, incluidos JPEG, PNG, BMP y más, así como proporcionar cifrado para archivos PDF.

Características avanzadas de la API de procesamiento HTML de Java

Crear páginas HTML desde cero

Cargar archivo existente

Implementar especificaciones W3C

Componente ligero e independiente

Insertar, reemplazar o eliminar nodos

Extraer información de estilo CSS

Cargue formatos de documentos EPUB y MHTML

Renderizar HTML a imágenes rasterizadas

Características de la API en la documentación

Puede ver la lista completa de funciones de Aspose.HTML en nuestra documentación. El uso de la biblioteca Aspose.HTML para Java en su proyecto le permite realizar las siguientes tareas:

  • Crear o abrir un documento HTML existente desde diferentes fuentes (Aspose.HTML.Examples.QuickStart.DocumentOpenTests en el proyecto de ejemplos).
  • Manipulación de HTML: creación, edición, eliminación y reemplazo de nodos HTML a través de API.
  • Guardar documento HTML.
  • Extracción de estilos CSS para un nodo HTML particular.
  • Configuración de un entorno limitado de documentos que afecta el procesamiento de documentos HTML.
  • Navegación por un documento HTML de diferentes formas.
  • Conversión de documentos HTML en varios formatos admitidos: JPEG, PNG, BMP, TIFF, PDF, XPS y más.

Convertir HTML a formato PDF y XPS

La API admite la representación de HTML en las imágenes rasterizadas más utilizadas, incluidos los formatos BMP, TIFF, JPEG y PNG, PDF y XPS. Los desarrolladores pueden personalizar mediante la configuración de los aspectos de PageSetup para los formatos de diseño fijo resultantes, incluidos los números de página que se representarán, el tamaño de página resultante o la configuración de la compresión JPEG para las imágenes incrustadas.

Renderizar HTML como formatos de diseño fijo - Java


     
    // Load a file to be rendered
    HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");

    // Render HTML to PDF & XPS
    HtmlRenderer renderer = new HtmlRenderer();

    renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
    renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);


Puede probar en línea HTML Converter.

También puede convertir HTML, XHTML, MHTML, Markdown, EPUB o SVG en muchos otros formatos de archivo, incluidos algunos de los que se enumeran a continuación:

Conversión a imágenes ráster

Aspose.HTML para Java ofrece el motor de renderizado de alta fidelidad en su núcleo que puede convertir páginas HTML a los formatos de imagen rasterizados más utilizados, incluidos TIFF, BMP, PNG y JPEG, sin necesidad de ningún software o herramienta adicional.

Manipulación de archivos EPUB y MHTML

La biblioteca es capaz de cargar archivos EPUB y MHTML para realizar varias operaciones, incluida la conversión a formatos de imagen rasterizados y de diseño fijo.

Navegación de nodos HTML

La API admite la navegación a través del archivo HTML, ya sea por XPath, elementos o consultas del selector CSS, y uno puede insertar, extraer, eliminar o reemplazar nodos fácilmente.

Extraer todos los nodos de tipo ancla - Java


     
    // instance creation of HTMLDocument and loading HTML from URL
    HTMLDocument dct = new HTMLDocument("https://www.aspose.com");

    // get all anchor type nodes 
    NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");

    // display anchor text & href values for all nodes
    for (Node node : nodelist){

        HTMLAnchorElement anchor = (HTMLAnchorElement)node;
        System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
    }



Configurar Sandbox

La API de HTML le permite configurar un entorno limitado de documentos que afecta el procesamiento de documentos HTML, es decir; los estilos CSS en algunos casos dependen del tamaño de la pantalla.



  

Support and Learning Resources

  
  

Aspose.HTML ofrece API de procesamiento de HTML individuales para otros entornos de desarrollo populares, como se indica a continuación: