Aspose.HTML for .NET es una API de procesamiento de HTML avanzada para realizar una amplia gama de tareas de administración y manipulación dentro de aplicaciones multiplataforma. La API está diseñada para crear, modificar, extraer datos, convertir y representar documentos HTML sin ningún software externo. Además, es compatible con formatos de archivo populares como EPUB, MHTML, XML, SVG y Markdown, y se procesa en formatos de archivo PDF, DOCX, XPS e imagen. Aspose.HTML for .NET está escrito completamente en C# y se puede usar para crear cualquier tipo de aplicación .NET de 32 o 64 bits, incluidos ASP.NET, WCF, WinForms y .NET Core. Además, el modelo de objetos de documento HTML está integrado con formatos y especificaciones integrados como CSS, HTML Canvas, SVG, XPath y JavaScript listos para usar que amplían la funcionalidad de manipulación y la calidad de representación.

Características avanzadas de la API HTML de .NET

Características de la API en la documentación

Puede ver la lista completa de funciones de Aspose.HTML en nuestra documentación. El uso de la biblioteca Aspose.HTML C# en su proyecto le permite realizar las siguientes tareas:

Convierta HTML a PDF, imagen y otros formatos en C#

La API de C# permite, con solo unas pocas líneas de código, implementar HTML a PDF, HTML a imagen o cualquier otra conversión para sus aplicaciones .NET. El proceso de conversión es simple y confiable, por lo que Aspose.HTML for .NET API es una opción perfecta.

Convertir HTML a PDF – C#



using Aspose.HTML;
using Aspose.HTML.Saving;
using Aspose.HTML.Converters;
...

    // Load an HTML file to be converted
    using var document = new HTMLDocument("input.html")

    // Create an instance of the PdfSaveOptions class
    var pdfSaveOptions = new PdfSaveOptions();

    // Convert HTML to PDF
    Converter.ConvertHTML(document, pdfSaveOptions, "output.pdf");


Puede probar en línea HTML Converter.

También puede convertir HTML, XHTML, MHTML, Markdown, EPUB o SVG en muchos otros formatos de archivo, incluidos algunos de los que se enumeran a continuación:

Combine archivos HTML, MHTML, EPUB y MD

Aspose.HTML for .NET API facilita el proceso de combinación de archivos para los desarrolladores: carga archivos usando HTMLDocument class; crea una instancia de Renderer y un dispositivo de salida requerido; utiliza Render() método para fusionar todos los documentos HTML.
¡Además, puede fusionar archivos en tiempo real! Combine HTML, MHTML, Markdown y EPUB en PDF, XPS, DOCX, TIFF y muchos otros formatos de archivo:

Edición de archivos HTML

Aspose.HTML for .NET le permite crear y editar documentos HTML utilizando un modelo de objeto de documento (DOM). El DOM es una interfaz de programación para documentos HTML que representa el documento (como nodos y objetos) como un árbol de nodos, donde cada nodo representa una parte del documento. Aspose.HTML for .NET API le permite conectarse a la página y puede cambiar la estructura, el estilo y el contenido del documento. Puede modificar el documento insertando nuevos nodos y eliminando o editando el contenido de los nodos existentes.

  • navegar por documentos HTML utilizando varios métodos, como recorrido de elementos, recorrido de documentos, consultas XPath y consultas de selector CSS,
  • eliminar y reemplazar nodos HTML,
  • extraer y editar CSS de HTML,
  • configure un entorno limitado de documentos y más.

La API HTML de .NET ayuda a los desarrolladores a leer, modificar, navegar y editar documentos (X)HTML. Algunas funciones de edición de archivos que Aspose.HTML for .NET API puede realizar son las siguientes:

Puede editar fácilmente documentos, generar código HTML y extraer datos de la Web en línea o mediante programación utilizando las siguientes herramientas:

Soporte de rebajas

Markdown es un lenguaje de marcado con una sintaxis de formato de texto sin formato. Markdown se usa a menudo como formato para documentación y archivos Léame, ya que permite escribir en un estilo fácil de leer y escribir. Aspose.HTML proporciona un Markdown Converter potente y flexible que puede convertir en ambas direcciones de Markdown a HTML y de HTML a Markdown. Además, la API del convertidor tiene un conjunto de reglas predefinidas, por lo que puede convertir HTML a Markdown utilizando la sintaxis auténtica de Markdown, la modificación de Markdown con sabor de GitLab o incluso configurar las reglas para sus necesidades.

Convertir HTML a Markdown – C#



using Aspose.Html;
using Aspose.HTML.Saving;
...

	// Load an HTML file
	using var document = new HTMLDocument("document.html");

	// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
	document.Save("output.md", MarkdownSaveOptions.Git);


¡La conversión inversa es así de simple! Usando la biblioteca de clases Aspose.HTML en su aplicación C#, puede convertir fácilmente Markdown en un archivo HTML con solo una línea de código.

Convertir Markdown a HTML – C#



using Aspose.Html.Converters;
...

	// Convert Markdown to HTML
	Converter.ConvertMarkdown("document.md", "output.html");



Pruebe en línea Markdown Converter! Puede convertir Markdown a PDF, XPS, DOCX, JPG, PNG, BMP, TIFF, GIF y MHTML. Sube, transforma tus documentos y obtén resultados en unos segundos. No necesita ningún software adicional.

Aspose.HTML para la biblioteca .NET proporciona una API de análisis Markdown para la plataforma C#. Puede crear, editar, guardar, fusionar, convertir archivos MD a otros formatos de archivo y agregar enlaces, listas, bloques de código, imágenes y otros elementos en archivos Markdown siguiendo los enlaces:

Libros electrónicos y archivos web

Aspose.HTML for .NET es capaz de cargar archivos EPUB y MHTML para realizar varias operaciones, incluida la conversión a formatos de imagen rasterizados y de diseño fijo.

Convertir EPUB a PDF – C#



using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	// Open an existing EPUB file for reading
     using var stream = File.OpenRead("input.epub");

     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();

     // Call the ConvertEPUB method to convert EPUB to PDF
     Converter.ConvertEPUB(stream, options, "output.pdf");


Convertir MHTML a PDF – C#



using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	 // Open an existing MHTML file for reading
     using var stream = File.OpenRead("input.mht");

     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();

     // Call the ConvertMHTML method to convert MHTML to PDF
     Converter.ConvertMHTML(stream, options, output.pdf);



Puede probar en línea Convertidor MHTML y en línea EPUB Converter. Nuestras herramientas de conversión basadas en navegador funcionan desde todas las plataformas, incluido Windows , Linux, Mac OS, Android e iOS. Los convertidores son compatibles con todos los dispositivos de PC, teléfonos inteligentes y tabletas.

Raspado web

El raspado web, también conocido como recolección web, extracción de datos web o rastreo web, es una técnica para extraer datos de un sitio web. Aspose.HTML no es compatible con un módulo Web Scraping listo para usar. Sin embargo, al usar la API Aspose.HTML que se basa completamente en la especificación W3C y es compatible con las consultas XPath y CSS Selector, puede inspeccionar fácilmente el contenido de cualquier documento HTML y crear su propia solución Web Scraping.

Extracción de datos web simple – C#



using Aspose.Html;
...

    // Create an instance of the HTML document with a website as a parameter
    using var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API");

    // Get all anchor-elements
    var elements = document.QuerySelectorAll("a");

    // Dump the anchor-element data to the console
    elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
        {
            System.Console.WriteLine("[Href]: " + x.Href);
            System.Console.WriteLine("[Content]: " + x.TextContent);
        });



Aspose.HTML ofrece aplicaciones Extracción de datos gratuitas en línea que son una manera de obtener datos de sitios web. Nuestras aplicaciones son seguras, funcionan en cualquier plataforma y no requieren la instalación de ningún software. Los raspadores de datos se pueden usar para extraer imágenes, obtener palabras clave de una página web, etc. Son fáciles y claros de usar, pero potentes y confiables.

Otras características compatibles de Aspose.HTML for .NET API

¡Use la biblioteca Aspose.HTML C# para convertir, fusionar, editar documentos HTML, extraer datos de la web y más!



  

Support and Learning Resources

  
  

Aspose.HTML ofrece API de procesamiento de HTML individuales para otros entornos de desarrollo populares, como se indica a continuación: