如何在 C# 中将 HTML 转换为 XHTML

以下 C# 示例演示了如何转换 HTML 文档。 HTML 到 XHTML 的转换有多种情况,例如从 URL/网页读取、WYSISYG 编辑器生成的 HTML 或从保存的文件中读取。我们描述了从文件中读取 HTML 并使用 Save() 方法将 HTML 转换为 XHTML 的源代码。


使用 C# 将 HTML 转换为 XHTML

XHTML 被设计为更加结构化、更少的脚本和通用性,使用所有现有的 XML 工具并且更加独立于设备。要将 HTML 转换为 XHTML,我们将使用 Aspose.HTML for .NET API,这是一个功能丰富、功能强大且易于使用的文档操作和 C# 平台的转换 API。您可以通过对各种转换参数的完全控制,以编程方式将 HTML 转换为 XHTML。 HTML 到 XHTML 的转换有多种情况,例如从文件、URL、WYSISYG 编辑器、字符串或流中读取。强大的 C# API 允许您快速、高质量地将 HTML 转换为流行格式!


在 C# 中将 HTML 转换为 XHTML 的步骤

如果您想在您的产品中考虑转换功能,或者您想以编程方式将 HTML 转换为 XHTML,请参阅上面的 C# 代码示例或学习文档章节。请采取以下强制性步骤:

  1. 使用 HTMLDocument(string) 构造函数将 HTML 文档加载到 Document 对象中。您可以从文件、HTML 代码、流或 URL 加载 HTML。
  2. 调用 Save(string, HTMLSaveOptions) 方法。
  3. 传递带有 XHTML 文件扩展名的输出文件路径。
  4. XHTML 文件将被保存到指定路径。

文档中的 HTML 转换

出于各种原因,需要在格式之间进行转换:以熟悉、方便的格式工作,或利用不同格式完成特定任务。 Aspose.HTML for .NET API 允许您快速、高质量地将 HTML 转换为其他流行格式。请访问文档章节转换格式以了解有关 Aspose 的更多信息。用于 .NET API 转换功能的 HTML。本章描述了流行的转换器,以及最常见的转换场景的 C# 示例。


免费在线转换器

Aspose.HTML 提供免费的在线应用程序,用于转换HTML, XHTML, MHTML, EPUBXMLMarkdown 文档到 PDF、XPS、DOCX、JPG、PNG、BMP、TIFF 、GIF、Markdown 等格式。只需上传、转换您的文档并在几秒钟内获得结果。您不需要任何额外的软件。强大的 C# API 允许将 HTML 快速、高质量地转换为流行格式。立即免费试用我们强大的在线转换器!

常问问题

1. 为什么要在 C# 中转换 HTML?

出于各种原因,需要在格式之间进行转换:以熟悉、方便的格式工作,或利用不同格式完成特定任务。有时 HTML 文件可能与某些软件不兼容,您需要将它们转换为另一种文件格式才能打开和阅读它们。

2. 如何将 HTML 转换为 XHTML?

Aspose.HTML 允许您以任何方式将 HTML 转换为 XHTML – 在线或以编程方式。 例如,您可以使用在线 HTML 转换器实时快速转换文件。 只需上传文件,运行转换器,几秒钟内即可获得结果! 或者,您可以使用 Aspose.HTML for .NET API 和提供的 C# 代码以编程方式将 HTML 转换为 XHTML。

3. 我可以将 HTML 转换为哪些其他文件格式?

Aspose.HTML API 提供广泛的 HTML 转换为流行格式,例如 PDF、XPS、DOCX、JPEG、PNG、BMP、TIFF、GIF 等。

4. Aspose.HTML 支持哪些格式?

我们开箱即用地支持 HTML、XHTML、SVG、EPUB、MHTML 和 Markdown 文档。作为上述文档的一部分,我们还支持 CSS、JavaScript、XPath 和 HTML5 Canvas 规范。

如何为 .NET 库安装 Aspose.HTML

您可以使用多种方式在您的系统上安装适用于 .NET 的 Aspose.HTML 库:

  1. 使用 NuGet 包管理器 GUI 安装 NuGet 包
  2. 使用包管理器控制台安装 NuGet 包。
  3. 通过 MSI 安装 Aspose.HTML for .NET。

该库支持解析 HTML5、CSS3、SVG 和 HTML Canvas,以构建基于 WHATWG DOM 标准的文档对象模型 (DOM)。 Aspose.HTML for .NET 完全用 C# 编写,可用于构建任何类型的 32 位或 64 位 .NET 应用程序,包括 ASP.NET、WCF、WinForms 和 .NET Core。在运行 .NET 转换示例代码之前,请确保您拥有 Microsoft Windows 等操作系统或与 .NET Framework 或 .NET Standard 兼容的操作系统,以及 Microsoft Visual Studio 等开发环境。有关 C# 库安装和系统要求的更多详细信息,请参阅 Aspose.HTML 文档

HTML 什么是HTML文件格式

HTML(超文本标记语言)是为在浏览器中显示而创建的文档的标准标记语言。最新的变体,称为 HTML 5,为使用该语言提供了很大的灵活性。 HTML 页面要么从托管这些页面的服务器接收,要么也可以从本地系统加载。每个 HTML 页面都由 HTML 元素组成,例如表单、文本、图像、动画、链接等。这些元素由 img、a、p 等标签表示,其中每个标签都有一个开始和结束。它还可以嵌入以 JavaScript 和样式表 (CSS) 等脚本语言编写的应用程序,以实现整体布局表示。

XHTML 什么是XHTML文件格式

XHTML(可扩展超文本标记语言)是一种基于文本的文件格式,使用 XML 中的标记,使用 HTML 4.0 的重新表述。这些文件非常适合在 Web 浏览器中打开或查看。 XHTML 被设计成更结构化、更少的脚本、通用和设备独立。它使用所有现有的 XML 工具等等。 XHTML 提供了一组通常有价值的元素和属性,以及与样式表相结合的扩展选项。万维网联盟 (W3C) 正在动态开发 HTML 4.01、HTML5 和 XHTML 的规范。

其他支持的 HTML 转换

您还可以将 HTML 转换为许多其他文件格式:

HTML TO PDF (Portable Document Format)
HTML TO DOCX (Microsoft Word)
HTML TO XPS (XML Paper Specifications)
HTML TO BMP (Bitmap Image)
HTML TO IMAGE (Image formats)
HTML TO JPEG (JPEG Image)
HTML TO GIF (Graphical Interchange Format)
HTML TO PNG (Portable Network Graphics)
HTML TO TIFF (Tagged Image Format)
HTML TO MD (Markdown Language)
HTML TO MHTML (Web Page Archive Format)
HTML TO XHTML (Extensible HyperText Markup Language)