该软件库为 JavaScript 开发人员提供了一组函数来将文件 HTML 拆分为多个部分。将 HTML 拆分为单独的文件可用于更轻松地并行处理文档的各个部分。例如,如果几个人同时在一个 HTML 上工作,那么拆分 HTML 可以让他们加快工作速度。拆分 HTML 可能是从文件 HTML 中提取文本并将数据集成到自动化信息系统或数据库中的技术的一部分。
我们的库为 JavaScript 开发人员提供了将 HTML 拆分为多个部分并根据指定模式提取页面所需的所有功能。这是一个独立的 Node.js via .NET 解决方案,不需要安装 Microsoft Word、Acrobat Reader 或其他应用程序。
使用 JavaScript 代码中的不同标准拆分 HTML 内容。您可以对 HTML 文件使用以下页面提取模式:"按标题拆分"、"按节拆分"、"按页拆分"、"按页面范围拆分"。
将文件 HTML 为多个部分后,您可以使用 'Document.Save' 方法将结果导出为所需的文件格式。您还可以使用 'DocumentPartSavingCallback' 属性控制 HTML 部分如何导出到 HTML 或 EPUB,这将允许您重定向输出流。
使用我们的 Node.js via .NET 解决方案轻松拆分文档 HTML Node.js via .NET 。以下示例显示如何使用 JavaScript 拆分 HTML JavaScript:
npm install @aspose/words
复制
const aw = require('@aspose/words');
var doc = new aw.Document("Input.html")
for (var page = 0; page < doc.pageCount; page++) {
var extractedPage = doc.extractPages(page, 1);
extractedPage.save(`Output_${page + 1}.html`);
}
We host our Node.js via .Net packages in NPM repositories. Please follow the step-by-step instructions on how to install "Aspose.Words for Node.js via .NET" to your developer environment.
This package is compatible with Node.js 14.17.0 or higher.