Cómo editar MHTML en C#

Los archivos MHTML representan un formato de archivo de página web que pueden crear varias aplicaciones diferentes. El formato se conoce como formato de archivo porque guarda el código HTML web y los recursos asociados en un solo archivo.
Editaremos archivos MHTML utilizando Aspose.HTML para .NET API , que es una API rica en funciones, potente y fácil de usar para la plataforma C#. El espacio de nombres Aspose.Html.Dom (Document Object Model) contiene clases y métodos para manipular documentos HTML sobre la marcha. Puede insertar, eliminar, reemplazar nodos HTML, extraer información de estilo CSS, obtener el contenido de los elementos y navegar a través del documento HTML mediante varios selectores de datos.

Nota: La edición de documentos MHTML pasa por la etapa de edición de documentos HTML. Puede cargar un documento HTML, editarlo y guardarlo en formato MHTML.


Código para editar archivos MHTML usando C#

Con la biblioteca de C#, puede editar documentos MHTML mediante programación: cambie la estructura, el estilo y el contenido del documento. Veamos cómo diseñar el elemento de párrafo <p> en un archivo MHTML. Agregamos el atributo style al primer elemento de párrafo en el documento.

Código C# para editar archivos MHTML

    // Prepare path to source HTML file
    string documentPath = Path.Combine(DataDir, "file.html");

    // Prepare path for edited MHTML file saving 
    string savePath = Path.Combine(OutputDir, "file-edited-style.mhtml");

    // Initialize an HTML document from the file
    using var document = new HTMLDocument(documentPath);

    // Create a CSS Selector that extracts the first paragraph element in the document
    var element = document.QuerySelector("p");

    // Print content of the first paragraph  
    Output.WriteLine(element.InnerHTML);
    // output: Aspose.HTML for .NET is a cross-platform class library that enables your applications to perform a wide range of HTML manipulation tasks.

    // Set style attribute with properties for the selected element
    element.SetAttribute("style", "color:rgb(50,150,200); background-color:#e1f0fe;");

    // Create MHTML save options object
    var options = new MHTMLSaveOptions();

    // Save the HTML document as an MHTML file
    document.Save(savePath, options);



Pasos para dar style a un elemento de párrafo en un documento MHTML usando C#

Considere pasos simples para editar un documento existente. En el documento aplicaremos style al primer párrafo:

  1. Cargue un documento HTML utilizando uno de los constructores HTMLDocument() . Puede cargar HTML desde un archivo, código HTML, transmisión o URL.
  2. Cree un Selector de CSS que extraiga el primer elemento del documento que coincida con el selector. Utilice el método QuerySelector(“p”) de la clase Document que devuelve el primer <p> elemento en el documento.
  3. Establecer atributo de style con propiedades para el elemento seleccionado. Use el método SetAttribute() para agregar el atributo de style con sus pares de propiedad y valor.
  4. Cree un objeto de opciones de guardado MHTML utilizando el constructor MHTMLSaveOptions() .
  5. Guarde el archivo HTML editado como un documento MHTML utilizando el método Save().

Cómo eliminar elementos de un archivo MHTML en C#

El siguiente ejemplo de código C# muestra cómo eliminar el último párrafo en un documento MHTML:

Código C# para editar archivos MHTML

    // Prepare path to source HTML file
    string documentPath = Path.Combine(DataDir, "file.html");

    // Prepare path for edited MHTML file saving 
    string savePath = Path.Combine(OutputDir, "file-remove-p.mhtml");

    // Initialize an HTML document from the file
    using var document = new HTMLDocument(documentPath);

    // Find the last document paragraph element 
    var p = document.GetElementsByTagName("p").Last();

    // Remove paragraph element
    p.Remove();

    // Create MHTML save options object
    var options = new MHTMLSaveOptions();

    // Save the HTML document as an MHTML file
    document.Save(savePath, options);



Documentación

Para obtener más información sobre la API de Aspose.HTML, visite nuestra guía documentación y Referencia de la API . Puede descargar los ejemplos y mostrar proyectos desde el repositorio GitHub . Son de código abierto y se pueden utilizar libremente en sus propias aplicaciones.

El artículo de documentación Edición de un documento HTML le brinda información básica sobre cómo leer o editar el objeto del documento. Modelo usando Aspose.HTML para .NET API. Explorará cómo crear elementos HTML y cómo trabajar con ellos: modifique el documento insertando nuevos nodos, eliminando o editando el contenido de los nodos existentes.

Los artículos del capítulo Artículos de procedimientos responden preguntas populares sobre cómo trabajar con archivos HTML. Además, los artículos contienen ejemplos de C# que brindan la información necesaria sobre el uso de la biblioteca de clases Aspose.HTML para resolver tareas específicas, por ejemplo, cómo cambiar el estilo de texto en un párrafo, cómo aplicar selectores de manera efectiva para seleccionar los elementos que desea editar, etc


FAQ

1. ¿Cómo puedo editar MHTML en C#?

La biblioteca Aspose.HTML para .NET es una solución de edición MHTML independiente que no depende de otro software. Instale nuestra biblioteca de C#, agregue la referencia de la biblioteca a su proyecto de C# y edite y administre mediante programación documentos MHTML.

2. ¿Dónde puedo encontrar más información sobre la edición de MHTML?

Visite nuestra documentación para obtener más información sobre el uso de Aspose.HTML para la API de .NET para editar MHTML. Si tiene preguntas sobre la funcionalidad, problemas encontrados o necesita una nueva función, inicie una discusión en nuestro foro de soporte gratuito.

3. ¿Puedo editar archivos MHTML en Linux, Mac OS, Android o iOS?

Puede editar documentos MHTML en cualquier sistema operativo, ya sea que use Windows, Mac OS, Linux, Android o iOS.

4. ¿Qué formatos de archivo puedo editar con la biblioteca Aspose.HTML C#?

Admitimos algunos formatos de archivo que puede editar en C#, incluidos HTML, MHTML y Markdown.



Introducción a la API HTML de .NET

Puede usar varias formas de instalar la biblioteca Aspose.HTML para .NET en su sistema:

  1. Instale un Paquete NuGet mediante la GUI del Administrador de paquetes NuGet.
  2. Instale un paquete NuGet mediante la Consola del administrador de paquetes. Puede usar el siguiente comando PM> Install-Package Aspose.Html.
  3. Instale Aspose.HTML para .NET a través de MSI.

Esta biblioteca admite el análisis de HTML5, CSS3, SVG y HTML Canvas para construir un modelo de objeto de documento (DOM) basado en el estándar WHATWG DOM. Aspose.HTML para .NET está escrito completamente en C# y se puede usar para crear cualquier tipo de aplicación .NET de 32 o 64 bits, incluidos ASP.NET, WCF, WinForms y .NET Core. Antes de ejecutar el código de ejemplo de conversión de .NET, asegúrese de tener un sistema operativo como Microsoft Windows o compatible con .NET Framework o .NET Standard, y el entorno de desarrollo como Microsoft Visual Studio. Para obtener más detalles sobre la instalación de la biblioteca de C# y los requisitos del sistema, consulte Documentación de Aspose.HTML.