Como editar MHTML em C#

Os arquivos MHTML representam um formato de arquivo de página da Web que pode ser criado por vários aplicativos diferentes. O formato é conhecido como formato de arquivo porque salva o código HTML da Web e os recursos associados em um único arquivo.
Editaremos arquivos MHTML usando Aspose.HTML para .NET API , que é uma API rica em recursos, poderosa e fácil de usar para a plataforma C#. O namespace Aspose.Html.Dom (Document Object Model) contém classes e métodos para manipular documentos HTML em tempo real. Você pode inserir, remover, substituir nós HTML, extrair informações de estilo CSS, obter o conteúdo dos elementos e navegar pelo documento HTML por vários seletores de dados.

Observação: A edição de documentos MHTML passa pelo estágio de edição de documentos HTML. Você pode carregar um documento HTML, editá-lo e salvá-lo no formato MHTML.


Código para editar arquivo MHTML usando C#

Usando a biblioteca C#, você pode editar documentos MHTML programaticamente – altere a estrutura, o estilo e o conteúdo do documento. Vejamos como estilizar o elemento de parágrafo <p> em um arquivo MHTML. Adicionamos o atributo estilo ao primeiro elemento de parágrafo no documento.

Código C# para editar arquivos MHTML

    // Prepare path to source HTML file
    string documentPath = Path.Combine(DataDir, "file.html");

    // Prepare path for edited MHTML file saving 
    string savePath = Path.Combine(OutputDir, "file-edited-style.mhtml");

    // Initialize an HTML document from the file
    using var document = new HTMLDocument(documentPath);

    // Create a CSS Selector that extracts the first paragraph element in the document
    var element = document.QuerySelector("p");

    // Print content of the first paragraph  
    Output.WriteLine(element.InnerHTML);
    // output: Aspose.HTML for .NET is a cross-platform class library that enables your applications to perform a wide range of HTML manipulation tasks.

    // Set style attribute with properties for the selected element
    element.SetAttribute("style", "color:rgb(50,150,200); background-color:#e1f0fe;");

    // Create MHTML save options object
    var options = new MHTMLSaveOptions();

    // Save the HTML document as an MHTML file
    document.Save(savePath, options);



Etapas para estilizar elemento de parágrafo em documento MHTML usando C#

Considere etapas simples para editar um documento existente. No documento, estilizaremos o primeiro parágrafo:

  1. Carregue um documento HTML usando um dos construtores HTMLDocument(). Você pode carregar HTML de um arquivo, código HTML, fluxo ou URL.
  2. Crie um seletor de CSS que extraia o primeiro elemento no documento que corresponda ao seletor. Use o método QuerySelector(“p”) da classe Document que retorna o primeiro <p> elemento no documento.
  3. Defina o atributo de estilo com propriedades para o elemento selecionado. Use o método SetAttribute() para adicionar o atributo de estilo com seus pares de propriedade e valor.
  4. Crie um objeto de opções de salvamento MHTML usando o construtor MHTMLSaveOptions().
  5. Salve o arquivo HTML editado como um documento MHTML usando o método Save().

Como remover o elemento do arquivo MHTML em C#

O exemplo de código C# a seguir mostra como remover o último parágrafo em um documento MHTML:

Código C# para editar arquivos MHTML

    // Prepare path to source HTML file
    string documentPath = Path.Combine(DataDir, "file.html");

    // Prepare path for edited MHTML file saving 
    string savePath = Path.Combine(OutputDir, "file-remove-p.mhtml");

    // Initialize an HTML document from the file
    using var document = new HTMLDocument(documentPath);

    // Find the last document paragraph element 
    var p = document.GetElementsByTagName("p").Last();

    // Remove paragraph element
    p.Remove();
            
    // Create MHTML save options object
    var options = new MHTMLSaveOptions();

    // Save the HTML document as an MHTML file
    document.Save(savePath, options);



Documentação

Para saber mais sobre a API Aspose.HTML, visite nosso guia de documentação e Referência da API. Você pode baixar os exemplos e mostrar projetos do repositório GitHub . Eles são de código aberto e podem ser usados ​​livremente em seus próprios aplicativos.

O artigo de documentação Editando um documento HTML fornece informações básicas sobre como ler ou editar o objeto Document Modele usando Aspose.HTML para API .NET. Você explorará como criar elementos HTML e como trabalhar com eles – modifique o documento inserindo novos nós, removendo ou editando o conteúdo de nós existentes.
Os artigos no capítulo How-To Articles respondem a perguntas populares sobre como trabalhar com arquivos HTML. Além disso, os artigos contêm exemplos de C# que fornecem as informações necessárias sobre como usar a biblioteca de classes Aspose.HTML para resolver tarefas específicas, como como alterar o estilo de texto em um parágrafo, como aplicar seletores de forma eficaz para selecionar os elementos que você deseja editar, etc


FAQ

1. Como posso editar MHTML em C#?

A Biblioteca Aspose.HTML for .NET é uma solução de edição independente MHTML que não depende de outro software. Instale nossa biblioteca C#, adicione a referência da biblioteca ao seu projeto C# e edite e gerencie documentos MHTML programaticamente.

2. Onde posso encontrar mais informações sobre a edição de MHTML?

Visite nossa documentação para saber mais sobre como usar o Aspose.HTML for .NET API para editar MHTML. Se você tiver dúvidas sobre funcionalidade, problemas encontrados ou precisar de um novo recurso, inicie uma discussão em nosso fórum de suporte gratuito.

3. Posso editar arquivos MHTML no Linux, Mac OS, Android ou iOS?

Você pode editar documentos MHTML em qualquer sistema operacional, esteja usando Windows, Mac OS, Linux, Android ou iOS.

4. Quais formatos de arquivo posso editar com a biblioteca Aspose.HTML C#?

Oferecemos suporte a alguns formatos de arquivo que você pode editar em C#, incluindo HTML, MHTML e Markdown.



Introdução à API HTML .NET

Você pode usar várias maneiras de instalar a biblioteca Aspose.HTML para .NET em seu sistema:

  1. Instale um Pacote NuGet usando a GUI do NuGet Package Manager.
  2. Instale um pacote NuGet usando o console do gerenciador de pacotes. Você pode usar o seguinte comando PM> Install-Package Aspose.Html.
  3. Instale o Aspose.HTML para .NET através do MSI.

Esta biblioteca suporta a análise de HTML5, CSS3, SVG e HTML Canvas para construir um Document Object Model (DOM) baseado no WHATWG DOM Standard. Aspose.HTML para .NET foi totalmente escrito em C# e pode ser usado para criar qualquer tipo de aplicativo .NET de 32 ou 64 bits, incluindo ASP.NET, WCF, WinForms e .NET Core. Antes de executar o código de exemplo de conversão .NET, certifique-se de ter um sistema operacional como o Microsoft Windows ou compatível com .NET Framework ou .NET Standard e o ambiente de desenvolvimento como o Microsoft Visual Studio. Para obter mais detalhes sobre a instalação da biblioteca C# e os requisitos do sistema, consulte Documentação do Aspose.HTML.