Aspose.HTML for .NET é uma API avançada de processamento de HTML para executar uma ampla gama de tarefas de gerenciamento e manipulação em aplicativos de plataforma cruzada. A API foi projetada para criar, modificar, extrair dados, converter e renderizar documentos HTML sem nenhum software externo. Além disso, ele oferece suporte a formatos de arquivo populares, como EPUB, MHTML, XML, SVG e Markdown e renderização em PDF, DOCX, XPS e formatos de arquivo de imagem. Aspose.HTML for .NET foi totalmente escrito em C# e pode ser usado para criar qualquer tipo de aplicativo .NET de 32 ou 64 bits, incluindo ASP.NET, WCF, WinForms e .NET Core. Além disso, o Modelo de Objeto de Documento HTML é integrado com formatos e especificações incorporados, como CSS, HTML Canvas, SVG, XPath e JavaScript prontos para uso, que estendem a manipulação funcional e a qualidade de renderização.
Recursos avançados da API HTML .NET
Preencha o modelo com várias fontes de dados
Implementar especificações do W3C
Renderize vários documentos de uma só vez
Aplicar cabeçalho e rodapé durante a conversão de HTML para PDF
Extrair dados da Web
Recursos da API na documentação
Você pode ver a lista completa de recursos do Aspose.HTML em nossa documentação. Usar a biblioteca Aspose.HTML C# em seu projeto permite que você execute as seguintes tarefas:
- Crie ou carregue documentos baseados em HTML de um arquivo, URL, string ou stream.
- Converta documentos entre formatos populares.
- Crie manipuladores de mensagens personalizados para realizar uma tarefa específica.
- Navegue em documentos HTML usando XPath Query ou Seletor de CSS.
- Editar arquivos HTML inserindo novos nós, remover ou editar o conteúdo dos nós existentes.
- Renderize documentos com alta qualidade,
- e mais.
Converta HTML para PDF, imagem e outros formatos em C#
A API C# permite com apenas algumas linhas de código implementar HTML para PDF, HTML para Imagem ou qualquer outra conversão para seus aplicativos .NET. O processo de conversão é simples e confiável, tornando o Aspose.HTML for .NET API uma escolha perfeita.
Converter HTML para PDF – C#
using Aspose.HTML;
using Aspose.HTML.Saving;
using Aspose.HTML.Converters;
...
// Load an HTML file to be converted
using var document = new HTMLDocument("input.html")
// Create an instance of the PdfSaveOptions class
var pdfSaveOptions = new PdfSaveOptions();
// Convert HTML to PDF
Converter.ConvertHTML(document, pdfSaveOptions, "output.pdf");
Você pode experimentar o Conversor de HTML on-line.
Você também pode converter HTML, XHTML, MHTML, Markdown, EPUB ou SVG em muitos outros formatos de arquivo, incluindo alguns listados abaixo:
Mesclar arquivos HTML, MHTML, EPUB e MD
Aspose.HTML for .NET API torna o processo de mesclagem dos arquivos mais fácil para os desenvolvedores: carrega arquivos usando HTMLDocument classe; cria uma instância de Renderer e um dispositivo de saída necessário; usa o Render() método para mesclar todos os documentos HTML.
Além disso, você pode mesclar arquivos em tempo real! Combine HTML, MHTML, Markdown e EPUB em PDF, XPS, DOCX, TIFF e muitos outros formatos de arquivo:
Editando Arquivos HTML
Aspose.HTML for .NET permite que você crie e edite documentos HTML usando um Document Object Model (DOM). O DOM é uma interface de programação para documentos HTML que representa o documento (como nós e objetos) como uma árvore de nós, onde cada nó representa parte do documento. Aspose.HTML for .NET API permite que você se conecte à página e pode alterar a estrutura, estilo e conteúdo do documento. Você pode modificar o documento inserindo novos nós e removendo ou editando o conteúdo dos nós existentes.
- navegue em documentos HTML usando vários métodos, como passagem de elemento, passagem de documento, consultas XPath e consultas de seletor CSS,
- remover e substituir nós HTML,
- extrair e editar CSS de HTML,
- configurar uma sandbox de documento e muito mais.
A API .NET HTML ajuda os desenvolvedores a ler, modificar, navegar e editar documentos (X)HTML. Algumas funções de edição de arquivo que a API do Aspose.HTML for .NET pode executar são as seguintes:
Você pode facilmente editar documentos, gerar código HTML e extrair dados da Web online ou programaticamente usando as seguintes ferramentas:
Suporte de Markdown
Markdown é uma linguagem de marcação com uma sintaxe de formatação de texto simples. O Markdown é frequentemente usado como um formato para documentação e arquivos leia-me, pois permite escrever em um estilo fácil de ler e fácil de escrever. Aspose.HTML fornece um conversor de Markdown poderoso e flexível que pode converter em ambas as direções de Markdown para HTML e de HTML para Markdown. Além disso, a API do conversor possui um conjunto de regras predefinidas, para que você possa converter HTML em Markdown usando a sintaxe autêntica do Markdown, modificação do GitLab Flavored Markdown ou até mesmo configurar as regras para suas necessidades.
Converter HTML em Markdown – C#
using Aspose.Html;
using Aspose.HTML.Saving;
...
// Load an HTML file
using var document = new HTMLDocument("document.html");
// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
document.Save("output.md", MarkdownSaveOptions.Git);
A conversão reversa é simples assim! Usando a biblioteca de classes Aspose.HTML em seu aplicativo C#, você pode facilmente converter Markdown em um arquivo HTML com apenas uma linha de código!
Converter Markdown em HTML – C#
using Aspose.Html.Converters;
...
// Convert Markdown to HTML
Converter.ConvertMarkdown("document.md", "output.html");
Experimente o Conversor Markdown online! Você pode converter Markdown em PDF, XPS, DOCX, JPG, PNG, BMP, TIFF, GIF e MHTML. Carregue, transforme seus documentos e obtenha resultados em poucos segundos. Você não precisa de nenhum software adicional.
A biblioteca Aspose.HTML for .NET fornece API de análise Markdown para a plataforma C#. Você pode criar, editar, salvar, mesclar, converter arquivos MD em outros formatos de arquivo e adicionar links, listas, blocos de código, imagens e outros elementos em arquivos Markdown seguindo os links:
Livros eletrônicos e arquivos da Web
Aspose.HTML for .NET é capaz de carregar arquivos EPUB e MHTML para executar várias operações, incluindo a conversão para formatos de imagem de layout fixo e raster.
Converter EPUB para PDF – C#
using Aspose.Html.Converters;
using Aspose.Html.Saving;
...
// Open an existing EPUB file for reading
using var stream = File.OpenRead("input.epub");
// Create an instance of PdfSaveOptions
var options = new PdfSaveOptions();
// Call the ConvertEPUB method to convert EPUB to PDF
Converter.ConvertEPUB(stream, options, "output.pdf");
Converter MHTML para PDF – C#
using Aspose.Html.Converters;
using Aspose.Html.Saving;
...
// Open an existing MHTML file for reading
using var stream = File.OpenRead("input.mht");
// Create an instance of PdfSaveOptions
var options = new PdfSaveOptions();
// Call the ConvertMHTML method to convert MHTML to PDF
Converter.ConvertMHTML(stream, options, output.pdf);
Você pode experimentar o Conversor MHTML online e EPUB Converter. Nossas ferramentas de conversão baseadas em navegador funcionam em todas as plataformas, incluindo Windows , Linux, Mac OS, Android e iOS. Os conversores são compatíveis com todos os dispositivos de PC, smartphones e tablets.
Raspagem da web
A raspagem da Web, também conhecida como colheita na Web, extração de dados da Web ou rastreamento da Web, é uma técnica para extrair dados de um site. Aspose.HTML não oferece suporte a um módulo de Web Scraping pronto para uso. No entanto, usando a API Aspose.HTML que é totalmente baseada na especificação W3C e oferece suporte a consultas XPath e CSS Selector, você pode facilmente inspecionar o conteúdo de qualquer documento HTML e criar sua própria solução de Web Scraping.
Extração Simples de Dados da Web – C#
using Aspose.Html;
...
// Create an instance of the HTML document with a website as a parameter
using var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API");
// Get all anchor-elements
var elements = document.QuerySelectorAll("a");
// Dump the anchor-element data to the console
elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
{
System.Console.WriteLine("[Href]: " + x.Href);
System.Console.WriteLine("[Content]: " + x.TextContent);
});
Aspose.HTML oferece aplicativos Raspadores de dados gratuitos on-line que são uma maneira de obter dados de sites. Nossos Apps são seguros, funcionam em qualquer plataforma e não requerem nenhuma instalação de software. Os raspadores de dados podem ser usados para extrair imagens, obter palavras-chave de uma página da Web, etc. Eles são fáceis e claros de usar, mas fortes e confiáveis.
Outros recursos suportados da API do Aspose.HTML for .NET
Use a biblioteca Aspose.HTML C# para converter, mesclar, editar documentos HTML, extrair dados da Web e muito mais!
Support and Learning Resources
- Recursos de aprendizagem
- Documentação
- Código fonte
- Referências de API
- Suporte ao produto
- Suporte Gratuito
- Suporte pago
- blog
- Notas de lançamento
- Por que Aspose.HTML for .NET?
- Lista de clientes
- Histórias de sucesso