该软件库为 C# 开发人员提供了一组函数来将文件 HTML 拆分为多个部分。将 HTML 拆分为单独的文件可用于更轻松地并行处理文档的各个部分。例如,如果几个人同时在一个 HTML 上工作,那么拆分 HTML 可以让他们加快工作速度。拆分 HTML 可能是从文件 HTML 中提取文本并将数据集成到自动化信息系统或数据库中的技术的一部分。
我们的库为 C# 开发人员提供了将 HTML 拆分为多个部分并根据指定模式提取页面所需的所有功能。这是一个独立的 .NET 解决方案,不需要安装 Microsoft Word、Acrobat Reader 或其他应用程序。
使用 C# 代码中的不同标准拆分 HTML 内容。您可以对 HTML 文件使用以下页面提取模式:"按标题拆分"、"按节拆分"、"按页拆分"、"按页面范围拆分"。
将文件 HTML 为多个部分后,您可以使用 'Document.Save' 方法将结果导出为所需的文件格式。您还可以使用 'DocumentPartSavingCallback' 属性控制 HTML 部分如何导出到 HTML 或 EPUB,这将允许您重定向输出流。
使用我们的 .NET 解决方案轻松拆分文档 HTML .NET 。以下示例显示如何使用 C# 拆分 HTML C#:
dotnet add package Aspose.Words
复制
using Aspose.Words;
var doc = new Document("Input.html");
for (var page = 0; page < doc.PageCount; page++)
{
var extractedPage = doc.ExtractPages(page, 1);
extractedPage.Save($"Output_{page + 1}.html");
}
在您的系统上 "Aspose.Words for .NET" 有三个备选选项。请选择符合您需求的一种,并按照分步说明进行操作:
我们的产品是完全跨平台的,并支持所有主要的 .NET 实现:
由于 .NET 代码不依赖于底层硬件或操作系统,而只依赖于虚拟机,因此您可以自由地为 Windows、macOS、Android、iOS 和 Linux 开发任何类型的软件。只需确保您已安装相应版本的.NET Framework, .NET Core, Windows Azure, Mono或Xamarin即可。
我们建议使用 Microsoft Visual Studio、Xamarin 和 MonoDevelop 集成开发环境来创建C#, F#, VB.NET应用程序。
更多详细信息请参阅产品文档。