Como editar MHTML em C#
Os arquivos MHTML representam um formato de arquivo de página da Web que pode ser criado por vários aplicativos diferentes. O formato é conhecido como formato de arquivo porque salva o código HTML da Web e os recursos associados em um único arquivo.
Editaremos arquivos MHTML usando
Aspose.HTML for .NET API
, que é uma API rica em recursos, poderosa e fácil de usar para a plataforma C#. O namespace
Aspose.Html.Dom
(Document Object Model) contém classes e métodos para manipular documentos HTML em tempo real. Você pode inserir, remover, substituir nós HTML, extrair informações de estilo CSS, obter o conteúdo dos elementos e navegar pelo documento HTML por vários seletores de dados.
Observação: A edição de documentos MHTML passa pelo estágio de edição de documentos HTML. Você pode carregar um documento HTML, editá-lo e salvá-lo no formato MHTML.
Código para editar arquivo MHTML usando C#
Usando a biblioteca C#, você pode editar documentos MHTML programaticamente – altere a estrutura, o estilo e o conteúdo do documento. Vejamos como estilizar o elemento de parágrafo <p>
em um arquivo MHTML. Adicionamos o atributo estilo
ao primeiro elemento de parágrafo no documento.
Código C# para editar arquivos MHTML
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-edited-style.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Create a CSS Selector that extracts the first paragraph element in the document
var element = document.QuerySelector("p");
// Print content of the first paragraph
Output.WriteLine(element.InnerHTML);
// output: Aspose.HTML for .NET is a cross-platform class library that enables your applications to perform a wide range of HTML manipulation tasks.
// Set style attribute with properties for the selected element
element.SetAttribute("style", "color:rgb(50,150,200); background-color:#e1f0fe;");
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
Etapas para estilizar elemento de parágrafo em documento MHTML usando C#
Considere etapas simples para editar um documento existente. No documento, estilizaremos o primeiro parágrafo:
- Carregue um documento HTML usando um dos construtores HTMLDocument(). Você pode carregar HTML de um arquivo, código HTML, fluxo ou URL.
- Crie um seletor de CSS que extraia o primeiro elemento no documento que corresponda ao seletor. Use o método
QuerySelector(“p”)
da classe Document que retorna o primeiro
<p>
elemento no documento. - Defina o atributo de estilo com propriedades para o elemento selecionado. Use o método SetAttribute() para adicionar o atributo de estilo com seus pares de propriedade e valor.
- Crie um objeto de opções de salvamento MHTML usando o construtor MHTMLSaveOptions().
- Salve o arquivo HTML editado como um documento MHTML usando o método Save().
Como remover o elemento do arquivo MHTML em C#
O exemplo de código C# a seguir mostra como remover o último parágrafo em um documento MHTML:
Código C# para editar arquivos MHTML
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-remove-p.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Find the last document paragraph element
var p = document.GetElementsByTagName("p").Last();
// Remove paragraph element
p.Remove();
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
Documentação
Para saber mais sobre a API Aspose.HTML, visite nosso guia de
documentação
e
Referência da API.
Você pode baixar os exemplos e mostrar projetos do repositório
GitHub
. Eles são de código aberto e podem ser usados livremente em seus próprios aplicativos.
O artigo de documentação
Editando um documento HTML
fornece informações básicas sobre como ler ou editar o objeto Document Modele usando Aspose.HTML para API .NET. Você explorará como criar elementos HTML e como trabalhar com eles – modifique o documento inserindo novos nós, removendo ou editando o conteúdo de nós existentes.
Os artigos no capítulo
How-To Articles
respondem a perguntas populares sobre como trabalhar com arquivos HTML. Além disso, os artigos contêm exemplos de C# que fornecem as informações necessárias sobre como usar a biblioteca de classes Aspose.HTML para resolver tarefas específicas, como como alterar o estilo de texto em um parágrafo, como aplicar seletores de forma eficaz para selecionar os elementos que você deseja editar, etc
FAQ
A Biblioteca Aspose.HTML for .NET é uma solução de edição independente MHTML que não depende de outro software. Instale nossa biblioteca C#, adicione a referência da biblioteca ao seu projeto C# e edite e gerencie documentos MHTML programaticamente.
Visite nossa documentação para saber mais sobre como usar o Aspose.HTML for .NET API para editar MHTML. Se você tiver dúvidas sobre funcionalidade, problemas encontrados ou precisar de um novo recurso, inicie uma discussão em nosso fórum de suporte gratuito.
Você pode editar documentos MHTML em qualquer sistema operacional, esteja usando Windows, Mac OS, Linux, Android ou iOS.
Oferecemos suporte a alguns formatos de arquivo que você pode editar em C#, incluindo HTML, MHTML e Markdown.
Introdução à API Aspose.HTML for .NET
Você pode usar várias maneiras de instalar a biblioteca Aspose.HTML for .NET em seu sistema:
- Instale um Pacote NuGet usando a GUI do NuGet Package Manager.
- Instale um pacote NuGet usando o console do gerenciador de pacotes. Você pode usar o seguinte comando
PM> Install-Package Aspose.Html
. - Instale o Aspose.HTML for .NET através do MSI.
Esta biblioteca suporta a análise de HTML5, CSS3, SVG e HTML Canvas para construir um Document Object Model (DOM) baseado no WHATWG DOM Standard. Aspose.HTML for .NET foi totalmente escrito em C# e pode ser usado para criar qualquer tipo de aplicativo .NET de 32 ou 64 bits, incluindo ASP.NET, WCF, WinForms e .NET Core. Antes de executar o código de exemplo de conversão .NET, certifique-se de ter um sistema operacional como o Microsoft Windows ou compatível com .NET Framework ou .NET Standard e o ambiente de desenvolvimento como o Microsoft Visual Studio. Para obter mais detalhes sobre a instalação da biblioteca C# e os requisitos do sistema, consulte Documentação do Aspose.HTML.
Outros editores suportados
Edite arquivos em outros formatos de arquivo: