Aspose.HTML for .NET é uma API avançada de processamento de HTML para executar uma ampla gama de tarefas de gerenciamento e manipulação em aplicativos de plataforma cruzada. A API foi projetada para criar, modificar, extrair dados, converter e renderizar documentos HTML sem nenhum software externo. Além disso, ele oferece suporte a formatos de arquivo populares, como EPUB, MHTML, XML, SVG e Markdown e renderização em PDF, DOCX, XPS e formatos de arquivo de imagem. Aspose.HTML for .NET foi totalmente escrito em C# e pode ser usado para criar qualquer tipo de aplicativo .NET de 32 ou 64 bits, incluindo ASP.NET, WCF, WinForms e .NET Core. Além disso, o Modelo de Objeto de Documento HTML é integrado com formatos e especificações incorporados, como CSS, HTML Canvas, SVG, XPath e JavaScript prontos para uso, que estendem a manipulação funcional e a qualidade de renderização.

Recursos avançados da API HTML .NET

Recursos da API na documentação

Você pode ver a lista completa de recursos do Aspose.HTML em nossa documentação. Usar a biblioteca Aspose.HTML C# em seu projeto permite que você execute as seguintes tarefas:

Converta HTML para PDF, imagem e outros formatos em C#

A API C# permite com apenas algumas linhas de código implementar HTML para PDF, HTML para Imagem ou qualquer outra conversão para seus aplicativos .NET. O processo de conversão é simples e confiável, tornando o Aspose.HTML for .NET API uma escolha perfeita.

Converter HTML para PDF – C#



using Aspose.HTML;
using Aspose.HTML.Saving;
using Aspose.HTML.Converters;
...

    // Load an HTML file to be converted
    using var document = new HTMLDocument("input.html")

    // Create an instance of the PdfSaveOptions class
    var pdfSaveOptions = new PdfSaveOptions();

    // Convert HTML to PDF
    Converter.ConvertHTML(document, pdfSaveOptions, "output.pdf");


Você pode experimentar o Conversor de HTML on-line.

Você também pode converter HTML, XHTML, MHTML, Markdown, EPUB ou SVG em muitos outros formatos de arquivo, incluindo alguns listados abaixo:

Mesclar arquivos HTML, MHTML, EPUB e MD

Aspose.HTML for .NET API torna o processo de mesclagem dos arquivos mais fácil para os desenvolvedores: carrega arquivos usando HTMLDocument classe; cria uma instância de Renderer e um dispositivo de saída necessário; usa o Render() método para mesclar todos os documentos HTML.
Além disso, você pode mesclar arquivos em tempo real! Combine HTML, MHTML, Markdown e EPUB em PDF, XPS, DOCX, TIFF e muitos outros formatos de arquivo:

Editando Arquivos HTML

Aspose.HTML for .NET permite que você crie e edite documentos HTML usando um Document Object Model (DOM). O DOM é uma interface de programação para documentos HTML que representa o documento (como nós e objetos) como uma árvore de nós, onde cada nó representa parte do documento. Aspose.HTML for .NET API permite que você se conecte à página e pode alterar a estrutura, estilo e conteúdo do documento. Você pode modificar o documento inserindo novos nós e removendo ou editando o conteúdo dos nós existentes.

  • navegue em documentos HTML usando vários métodos, como passagem de elemento, passagem de documento, consultas XPath e consultas de seletor CSS,
  • remover e substituir nós HTML,
  • extrair e editar CSS de HTML,
  • configurar uma sandbox de documento e muito mais.

A API .NET HTML ajuda os desenvolvedores a ler, modificar, navegar e editar documentos (X)HTML. Algumas funções de edição de arquivo que a API do Aspose.HTML for .NET pode executar são as seguintes:

Você pode facilmente editar documentos, gerar código HTML e extrair dados da Web online ou programaticamente usando as seguintes ferramentas:

Suporte de Markdown

Markdown é uma linguagem de marcação com uma sintaxe de formatação de texto simples. O Markdown é frequentemente usado como um formato para documentação e arquivos leia-me, pois permite escrever em um estilo fácil de ler e fácil de escrever. Aspose.HTML fornece um conversor de Markdown poderoso e flexível que pode converter em ambas as direções de Markdown para HTML e de HTML para Markdown. Além disso, a API do conversor possui um conjunto de regras predefinidas, para que você possa converter HTML em Markdown usando a sintaxe autêntica do Markdown, modificação do GitLab Flavored Markdown ou até mesmo configurar as regras para suas necessidades.

Converter HTML em Markdown – C#



using Aspose.Html;
using Aspose.HTML.Saving;
...

	// Load an HTML file
	using var document = new HTMLDocument("document.html");

	// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
	document.Save("output.md", MarkdownSaveOptions.Git);


A conversão reversa é simples assim! Usando a biblioteca de classes Aspose.HTML em seu aplicativo C#, você pode facilmente converter Markdown em um arquivo HTML com apenas uma linha de código!

Converter Markdown em HTML – C#



using Aspose.Html.Converters;
...

	// Convert Markdown to HTML
	Converter.ConvertMarkdown("document.md", "output.html");



Experimente o Conversor Markdown online! Você pode converter Markdown em PDF, XPS, DOCX, JPG, PNG, BMP, TIFF, GIF e MHTML. Carregue, transforme seus documentos e obtenha resultados em poucos segundos. Você não precisa de nenhum software adicional.

A biblioteca Aspose.HTML for .NET fornece API de análise Markdown para a plataforma C#. Você pode criar, editar, salvar, mesclar, converter arquivos MD em outros formatos de arquivo e adicionar links, listas, blocos de código, imagens e outros elementos em arquivos Markdown seguindo os links:

Livros eletrônicos e arquivos da Web

Aspose.HTML for .NET é capaz de carregar arquivos EPUB e MHTML para executar várias operações, incluindo a conversão para formatos de imagem de layout fixo e raster.

Converter EPUB para PDF – C#



using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	// Open an existing EPUB file for reading
     using var stream = File.OpenRead("input.epub");
    
     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();
    
     // Call the ConvertEPUB method to convert EPUB to PDF
     Converter.ConvertEPUB(stream, options, "output.pdf");


Converter MHTML para PDF – C#



using Aspose.Html.Converters;
using Aspose.Html.Saving;
...

	 // Open an existing MHTML file for reading
     using var stream = File.OpenRead("input.mht");

     // Create an instance of PdfSaveOptions
     var options = new PdfSaveOptions();

     // Call the ConvertMHTML method to convert MHTML to PDF
     Converter.ConvertMHTML(stream, options, output.pdf);



Você pode experimentar o Conversor MHTML online e EPUB Converter. Nossas ferramentas de conversão baseadas em navegador funcionam em todas as plataformas, incluindo Windows , Linux, Mac OS, Android e iOS. Os conversores são compatíveis com todos os dispositivos de PC, smartphones e tablets.

Raspagem da web

A raspagem da Web, também conhecida como colheita na Web, extração de dados da Web ou rastreamento da Web, é uma técnica para extrair dados de um site. Aspose.HTML não oferece suporte a um módulo de Web Scraping pronto para uso. No entanto, usando a API Aspose.HTML que é totalmente baseada na especificação W3C e oferece suporte a consultas XPath e CSS Selector, você pode facilmente inspecionar o conteúdo de qualquer documento HTML e criar sua própria solução de Web Scraping.

Extração Simples de Dados da Web – C#



using Aspose.Html;
...

    // Create an instance of the HTML document with a website as a parameter
    using var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API");

    // Get all anchor-elements
    var elements = document.QuerySelectorAll("a");

    // Dump the anchor-element data to the console
    elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
        {
            System.Console.WriteLine("[Href]: " + x.Href);
            System.Console.WriteLine("[Content]: " + x.TextContent);
        });



Aspose.HTML oferece aplicativos Raspadores de dados gratuitos on-line que são uma maneira de obter dados de sites. Nossos Apps são seguros, funcionam em qualquer plataforma e não requerem nenhuma instalação de software. Os raspadores de dados podem ser usados ​​para extrair imagens, obter palavras-chave de uma página da Web, etc. Eles são fáceis e claros de usar, mas fortes e confiáveis.

Outros recursos suportados da API do Aspose.HTML for .NET

Use a biblioteca Aspose.HTML C# para converter, mesclar, editar documentos HTML, extrair dados da Web e muito mais!



  

Support and Learning Resources

  
  

Aspose.HTML oferece APIs individuais de processamento de HTML para outros ambientes de desenvolvimento populares, conforme listado abaixo: