Как редактировать MHTML на C#

Файлы MHTML представляют собой формат архива веб-страницы, который может быть создан рядом различных приложений. Этот формат называется архивным, поскольку он сохраняет веб-код HTML и связанные с ним ресурсы в одном файле.
Мы будем редактировать файлы MHTML, используя Aspose.HTML for .NET API, который представляет собой многофункциональный, мощный и простой в использовании API для платформы C#. Пространство имен Aspose.Html.Dom содержит классы и методы для оперативного управления HTML-документами. Вы можете вставлять, удалять, заменять узлы HTML, извлекать информацию о стиле CSS, получать содержимое элементов и перемещаться по документу HTML с помощью различных селекторов данных.

Примечание. Редактирование документа MHTML проходит этап редактирования документа HTML. Вы можете загрузить документ HTML, отредактировать его и сохранить в формате MHTML.


Код для редактирования файла MHTML на С#

Используя библиотеку C#, вы можете программно редактировать документы MHTML – изменять структуру, стиль и содержимое документа. Давайте посмотрим, как стилизовать элемент абзаца <p> в файле MHTML – добавим атрибут style к первому в теле страницы элементу параграфа <p>.

Код C# для редактирования файлов MHTML

    // Prepare path to source HTML file
    string documentPath = Path.Combine(DataDir, "file.html");

    // Prepare path for edited MHTML file saving 
    string savePath = Path.Combine(OutputDir, "file-edited-style.mhtml");

    // Initialize an HTML document from the file
    using var document = new HTMLDocument(documentPath);

    // Create a CSS Selector that extracts the first paragraph element in the document
    var element = document.QuerySelector("p");

    // Print content of the first paragraph  
    Output.WriteLine(element.InnerHTML);
    // output: Aspose.HTML for .NET is a cross-platform class library that enables your applications to perform a wide range of HTML manipulation tasks.

    // Set style attribute with properties for the selected element
    element.SetAttribute("style", "color:rgb(50,150,200); background-color:#e1f0fe;");

    // Create MHTML save options object
    var options = new MHTMLSaveOptions();

    // Save the HTML document as an MHTML file
    document.Save(savePath, options);



Как добавить style атрибут в элемент абзаца в документе MHTML на C#

Рассмотрим простые шаги по редактированию существующего документа. В документе мы стилизуем первый абзац:

  1. Загрузите HTML-документ с помощью одного из конструкторов HTMLDocument() . Вы можете загрузить HTML из файла, HTML-кода, потока или URL-адреса.
  2. Создайте селектор CSS, который извлекает первый элемент в документе, соответствующий селектору. Используйте метод QuerySelector(“p”) класса Document, который возвращает первый <p> элемент в HTML документе.
  3. Установите атрибут стиля со свойствами для выбранного элемента. Используйте метод SetAttribute(), чтобы добавить атрибут стиля с парами свойств и значений.
  4. Создайте MHTML save options объект с помощью конструктора MHTMLSaveOptions().
  5. Сохраните отредактированный файл HTML как MHTML документ, используя Save() метод.

Как удалить элемент из файла MHTML на C#

В следующем примере кода C# показано, как удалить последний абзац в документе MHTML:

Код C# для редактирования файлов MHTML

    // Prepare path to source HTML file
    string documentPath = Path.Combine(DataDir, "file.html");

    // Prepare path for edited MHTML file saving 
    string savePath = Path.Combine(OutputDir, "file-remove-p.mhtml");

    // Initialize an HTML document from the file
    using var document = new HTMLDocument(documentPath);

    // Find the last document paragraph element 
    var p = document.GetElementsByTagName("p").Last();

    // Remove paragraph element
    p.Remove();
            
    // Create MHTML save options object
    var options = new MHTMLSaveOptions();

    // Save the HTML document as an MHTML file
    document.Save(savePath, options);



Документация

Чтобы узнать больше об Aspose.HTML API, посетите нашу документацию и Справочник по API. Вы можете скачать примеры и демонстрационные проекты из GitHub репозитория. Они имеют открытый исходный код и могут свободно использоваться в ваших собственных приложениях.

Статья документации Edit HTML Document содержит основную информацию о том, как читать или редактировать объектную модель документа с использованием Aspose.HTML for .NET API. Вы узнаете, как создавать элементы HTML и как с ними работать – изменять документ, вставляя новые узлы, удаляя или редактируя содержимое существующих узлов.

Статьи в главе How-To Articles содержат ответы на популярные вопросы о том, как работать с HTML-файлами. Кроме того, статьи содержат примеры C#, предоставляющие необходимую информацию об использовании библиотеки классов Aspose.HTML для решения конкретных задач, например, как изменить стиль текста в абзаце, как эффективно применять селекторы для выбора элементов, которые вы хотите редактировать и т.д.


FAQ

1. Как редактировать MHTML на C#?

Библиотека Aspose.HTML for .NET – это автономное решение для редактирования MHTML, которое не зависит от другого программного обеспечения. Установите нашу библиотеку C#, добавьте ссылку на библиотеку в свой проект C# и программно редактируйте MHTML документы и управляйте ими.

2. Где я могу найти дополнительную информацию о редактировании MHTML?

Ознакомьтесь с нашей документацией, чтобы узнать больше об использовании Aspose.HTML for .NET API для редактирования MHTML. Если у вас есть вопросы о функциональности, обнаруженных проблемах или вам нужна новая функция, начните обсуждение на нашем бесплатном форуме поддержки.

3. Можно ли редактировать MHTML на Linux, Mac OS, Android или iOS?

Вы можете редактировать MHTML-документы в любой операционной системе, независимо от того, используете ли вы Windows, Mac OS, Linux, Android или iOS.

4. Файлы каких форматов можно редактировать с помощью C# библиотеки Aspose.HTML?

Мы поддерживаем несколько форматов файлов, которые вы можете редактировать на C#, включая HTML, MHTML и Markdown.



Начало работы с Aspose.HTML for .NET API

Вы можете использовать несколько способов установки библиотеки Aspose.HTML for .NET в вашей системе:

  • Установите пакет NuGet с помощью графического интерфейса диспетчера пакетов NuGet.
  • Установите пакет NuGet с помощью консоли диспетчера пакетов.
  • Установите Aspose.HTML for .NET через MSI.

Aspose.HTML for .NET поддерживает синтаксический анализ HTML5, CSS3, SVG и HTML Canvas для создания объектной модели документа (DOM) на основе стандарта WHATWG DOM. Библиотека полностью написана на C# и может использоваться для создания любого типа 32-битного или 64-битного приложения .NET, включая ASP.NET, WCF, WinForms и .NET Core. Прежде чем запускать код примера преобразования .NET, убедитесь, что у вас есть ОС, такая как Microsoft Windows, или совместимая с .NET Framework или .NET Standard, и среда разработки, такая как Microsoft Visual Studio. Дополнительные сведения об установке библиотеки C# и системных требованиях вы найдете в документации Aspose.HTML.