Aspose.HTML for .NET 是一种高级 HTML 处理 API,用于在跨平台应用程序中执行广泛的管理和操作任务。 API 旨在创建、修改、提取数据、转换和呈现 HTML 文档,而无需任何外部软件。此外,它还支持流行的文件格式,如 EPUB、MHTML、XML、SVG 和 Markdown,以及呈现为 PDF、DOCX、XPS 和图像文件格式。 Aspose.HTML for .NET 完全用 C# 编写,可用于构建任何类型的 32 位或 64 位 .NET 应用程序,包括 ASP.NET、WCF、WinForms 和 .NET Core。此外,HTML 文档对象模型集成了嵌入式格式和规范,例如 CSS、HTML Canvas、SVG、XPath 和 JavaScript,开箱即用,扩展了操作功能和渲染质量。
高级 .NET HTML API 功能
new 检查网页内容的可访问性
用各种数据源填充模板
实施 W3C 规范
一次渲染多个文档
在 HTML 到 PDF 期间应用页眉和页脚
从 Web 中提取数据
文档中的 API 功能
您可以在我们的文档中查看完整的 Aspose.HTML 功能列表。在您的项目中使用 Aspose.HTML C# 库允许您执行以下任务:
- 创建或加载基于 HTML 的文档文件、URL、字符串或流。
- 在流行格式之间转换文档。
- 创建自定义消息处理程序以执行特定任务。
- 使用 XPath 查询导航 HTML 文档或 CSS 选择器。
- 编辑 HTML 文件 通过插入新节点,删除或编辑现有节点的内容。
- 高质量渲染文档,
- 和更多。
在 C# 中将 HTML 转换为 PDF、图像和其他格式
C# API 只需几行代码就可以为您的 .NET 应用程序实现 HTML 到 PDF、HTML 到图像或任何其他转换。转换过程简单可靠,因此使 Aspose.HTML for .NET API 成为完美的选择。
将 HTML 转换为 PDF – C#
using Aspose.HTML;
using Aspose.HTML.Saving;
using Aspose.HTML.Converters;
...
// Load an HTML file to be converted
using var document = new HTMLDocument("input.html")
// Create an instance of the PdfSaveOptions class
var pdfSaveOptions = new PdfSaveOptions();
// Convert HTML to PDF
Converter.ConvertHTML(document, pdfSaveOptions, "output.pdf");
您可以在 此处尝试在线 HTML 转换器。
您还可以将 HTML、XHTML、MHTML、Markdown、EPUB 或 SVG 转换为许多其他文件格式,包括下面列出的几种文件格式:
合并 HTML、MHTML、EPUB 和 MD 文件
Aspose.HTML for .NET API 使开发人员的文件合并过程更容易:使用 HTMLDocument 类加载文件; 创建 Renderer 实例和所需的输出设备; 使用 Render() 方法合并所有 HTML 文档。
此外,您可以实时合并文件! 将 HTML、MHTML、Markdown 和 EPUB 组合成 PDF、XPS、DOCX、TIFF 和许多其他文件格式:
编辑 HTML 文档
Aspose.HTML for .NET 允许您使用文档对象模型 (DOM) 创建和编辑 HTML 文档。 DOM 是 HTML 文档的编程接口,将文档(作为节点和对象)表示为节点树,其中每个节点代表文档的一部分。 Aspose.HTML for .NET API 允许您连接到页面并可以更改文档结构、样式和内容。您可以通过插入新节点以及删除或编辑现有节点的内容来修改文档。
.NET HTML API 帮助开发人员阅读、修改、导航和编辑 (X)HTML 文档。 Aspose.HTML for .NET API 可以执行的一些文件编辑功能如下:
- 使用各种方法导航 HTML 文档,例如元素遍历、文档遍历、XPath 查询和 CSS 选择器查询,
- 删除和替换 HTML 节点,
- 从 HTML 中提取和编辑 CSS,
- 配置文档沙箱等。
您可以使用以下工具轻松地在线或以编程方式编辑文档、生成 HTML 代码以及从网络上抓取数据:
降价支持
Markdown 是一种具有纯文本格式语法的标记语言。 Markdown 通常用作文档和自述文件的格式,因为它允许以易于阅读和易于编写的风格进行编写。 Aspose.HTML 提供了一个强大而灵活的 Markdown 转换器,可以双向转换从 Markdown 到 HTML 和从 HTML 到 Markdown。此外,转换器 API 具有一组预定义的规则,因此您可以使用正宗的 Markdown 语法、GitLab Flavored Markdown 修改将 HTML 转换为 Markdown,甚至可以根据需要配置规则。
将 HTML 转换为 Markdown – C#
using Aspose.Html;
using Aspose.HTML.Saving;
...
// Load an HTML file
using var document = new HTMLDocument("document.html");
// Convert HTML to Markdown using a set of features supported by GitLab Flavored Markdown
document.Save("output.md", MarkdownSaveOptions.Git);
反向转换就是这么简单!在您的 C# 应用程序中使用 Aspose.HTML 类库,您只需一行代码即可轻松地将 Markdown 转换为 HTML 文件!
将 Markdown 转换为 HTML – C#
using Aspose.Html.Converters;
...
// Convert Markdown to HTML
Converter.ConvertMarkdown("document.md", "output.html");
您可以在 此处尝试在线 Markdown 转换器。 您可以转换 Markdown转换为 PDF、XPS、DOCX、JPG、PNG、BMP、TIFF、GIF 和 MHTML。上传、转换您的文档并在几秒钟内获得结果。您不需要任何额外的软件。
Aspose.HTML for .NET 库为 C# 平台提供了 Markdown 解析 API。 您可以通过以下链接创建、编辑、保存、合并、转换 MD 文件为其他文件格式,以及将链接、列表、代码块、图像和其他元素添加到 Markdown 文件中:
电子书和网络档案
Aspose.HTML for .NET 能够加载 ePub 和 MHTML 文件以执行各种操作,包括转换为固定布局和光栅图像格式。
将 EPUB 转换为 PDF – C#
using Aspose.Html.Converters;
using Aspose.Html.Saving;
...
// Open an existing EPUB file for reading
using var stream = File.OpenRead("input.epub");
// Create an instance of PdfSaveOptions
var options = new PdfSaveOptions();
// Call the ConvertEPUB method to convert EPUB to PDF
Converter.ConvertEPUB(stream, options, "output.pdf");
将 MHTML 转换为 PDF – C#
using Aspose.Html.Converters;
using Aspose.Html.Saving;
...
// Open an existing MHTML file for reading
using var stream = File.OpenRead("input.mht");
// Create an instance of PdfSaveOptions
var options = new PdfSaveOptions();
// Call the ConvertMHTML method to convert MHTML to PDF
Converter.ConvertMHTML(stream, options, output.pdf);
您可以在线尝试MHTML Converter和在线 EPUB 转换器。 我们基于浏览器的转换工具适用于所有平台,包括 Windows 、Linux、Mac OS、Android 和 iOS。转换器与所有 PC 设备、智能手机和平板电脑兼容。
网页抓取
网络抓取,也称为网络收获、网络数据提取或网络爬虫,是一种从网站中提取数据的技术。 Aspose.HTML 不支持开箱即用的 Web Scraping 模块。但是,使用完全基于 W3C 规范并支持 XPath 和 CSS 选择器查询的 Aspose.HTML API,您可以轻松检查任何 HTML 文档的内容并创建自己的 Web Scraping 解决方案。
简单的 Web 数据提取 – C#
using Aspose.Html;
...
// Create an instance of the HTML document with a website as a parameter
using var document = new Aspose.Html.HTMLDocument("https://en.wikipedia.org/wiki/Aspose_API");
// Get all anchor-elements
var elements = document.QuerySelectorAll("a");
// Dump the anchor-element data to the console
elements.Cast<HTMLAnchorElement>().ToList().ForEach(x =>
{
System.Console.WriteLine("[Href]: " + x.Href);
System.Console.WriteLine("[Content]: " + x.TextContent);
});
Aspose.HTML 提供免费的在线 数据抓取工具 应用程序从网站获取数据的方法。我们的应用程序是安全的,可以在任何平台上运行,并且不需要安装任何软件。数据抓取器可用于图像提取、从网页中获取关键字等。它们使用简单明了,但功能强大且可靠。
其他受支持的 Aspose.HTML for .NET API 功能
使用 Aspose.HTML C# 库来转换、合并、编辑 HTML 文档,从网络中提取数据等等!