如何在 C# 中编辑 MHTML
MHTML 文件代表一种网页存档格式,可以由许多不同的应用程序创建。该格式被称为存档格式,因为它将 Web HTML 代码和相关资源保存在一个文件中。
我们将使用
Aspose.HTML for .NET API
编辑 MHTML 文件,这是一个功能丰富、功能强大且易于使用的 C# 平台 API。
Aspose.Html.Dom
(文档对象模型)命名空间包含动态操作 HTML 文档的类和方法。您可以插入、删除、替换 HTML 节点,提取 CSS 样式信息,获取元素的内容,以及通过各种数据选择器在 HTML 文档中导航。
注意: MHTML 文档编辑经过HTML 文档编辑阶段。您可以加载 HTML 文档,对其进行编辑并将其保存为 MHTML 格式。
使用 C# 编辑 MHTML 文件的代码
使用 C# 库,您可以以编程方式编辑 MHTML 文档 – 更改文档结构、样式和内容。让我们看看如何在 MHTML 文件中设置 <p>
段落元素的样式。我们将 style
属性添加到文档中的第一个段落元素。
编辑 MHTML 文件的 C# 代码
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-edited-style.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Create a CSS Selector that extracts the first paragraph element in the document
var element = document.QuerySelector("p");
// Print content of the first paragraph
Output.WriteLine(element.InnerHTML);
// output: Aspose.HTML for .NET is a cross-platform class library that enables your applications to perform a wide range of HTML manipulation tasks.
// Set style attribute with properties for the selected element
element.SetAttribute("style", "color:rgb(50,150,200); background-color:#e1f0fe;");
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
使用 C# 在 MHTML 文档中设置段落元素样式的步骤
考虑编辑现有文档的简单步骤。在文档中,我们将设置第一段的样式:
- 使用 HTMLDocument() 构造函数之一加载 HTML 文档。您可以从文件、HTML 代码、流或 URL 加载 HTML。
- 创建一个 CSS 选择器,提取文档中匹配选择器的第一个元素。使用返回第一个
<p>
的文档类的 QuerySelector(“p”) 方法文档中的元素。 - 为所选元素设置带有属性的样式属性。使用 SetAttribute() 方法添加样式属性及其属性和值对。
- 使用 MHTMLSaveOptions() 构造函数创建 MHTML 保存选项对象。
- 使用 Save() 方法将编辑后的 HTML 文件保存为 MHTML 文档。
如何在 C# 中从 MHTML 文件中删除元素
以下 C# 代码示例显示了如何删除 MHTML 文档中的最后一段:
编辑 MHTML 文件的 C# 代码
// Prepare path to source HTML file
string documentPath = Path.Combine(DataDir, "file.html");
// Prepare path for edited MHTML file saving
string savePath = Path.Combine(OutputDir, "file-remove-p.mhtml");
// Initialize an HTML document from the file
using var document = new HTMLDocument(documentPath);
// Find the last document paragraph element
var p = document.GetElementsByTagName("p").Last();
// Remove paragraph element
p.Remove();
// Create MHTML save options object
var options = new MHTMLSaveOptions();
// Save the HTML document as an MHTML file
document.Save(savePath, options);
文档
要了解有关 Aspose.HTML API 的更多信息,请访问我们的
文档
指南和
API 参考。
您可以从
GitHub
存储库下载示例和展示项目。它们是开源的,可以在您自己的应用程序中自由使用。
Edit HTML Document
文档文章为您提供了有关如何阅读或编辑文档对象的基本信息使用 Aspose.HTML for .NET API 建模。您将探索如何创建 HTML 元素以及如何使用它们 – 通过插入新节点、删除或编辑现有节点的内容来修改文档。
How-To Articles 章节中的文章回答了有关如何使用 HTML 文件的常见问题。此外,文章包含 C# 示例,提供有关使用 Aspose.HTML 类库解决特定任务的必要信息,例如如何更改段落中的文本样式,如何有效地应用选择器来选择您想要的元素编辑等
FAQ
Aspose.HTML for .NET 库是一个独立的 MHTML 编辑解决方案,不依赖于其他软件。安装我们的 C# 库,将库引用添加到您的 C# 项目,并以编程方式编辑和管理 MHTML 文档。
请访问我们的文档,了解有关使用 Aspose.HTML for .NET API 编辑 MHTML 的更多信息。 如果您对功能有疑问、发现问题或需要新功能,请在我们的免费支持论坛中开始讨论。
您可以在任何操作系统上编辑 MHTML 文档,无论您使用的是 Windows、Mac OS、Linux、Android 还是 iOS。
我们支持一些可以在 C# 中编辑的文件格式,包括 HTML、MHTML 和 Markdown。
.NET HTML API 入门
您可以使用多种方式在您的系统上安装适用于 .NET 的 Aspose.HTML 库:
- 使用 NuGet 包管理器 GUI 安装 NuGet 包。
- 使用包管理器控制台安装 NuGet 包。
- 通过 MSI 安装 Aspose.HTML for .NET。
该库支持解析 HTML5、CSS3、SVG 和 HTML Canvas,以构建基于 WHATWG DOM 标准的文档对象模型 (DOM)。 Aspose.HTML for .NET 完全用 C# 编写,可用于构建任何类型的 32 位或 64 位 .NET 应用程序,包括 ASP.NET、WCF、WinForms 和 .NET Core。在运行 .NET 转换示例代码之前,请确保您拥有 Microsoft Windows 等操作系统或与 .NET Framework 或 .NET Standard 兼容的操作系统,以及 Microsoft Visual Studio 等开发环境。有关 C# 库安装和系统要求的更多详细信息,请参阅 Aspose.HTML 文档 。