該軟件庫為 C++ 開發人員提供了一組函數來將文件 HTML 拆分為多個部分。將 HTML 拆分為單獨的文件可用於更輕鬆地並行處理文檔的各個部分。例如,如果幾個人同時在一個 HTML 上工作,那麼拆分 HTML 可以讓他們加快工作速度。拆分 HTML 可能是從文件 HTML 中提取文本並將數據集成到自動化信息系統或數據庫中的技術的一部分。
我們的庫為 C++ 開發人員提供了將 HTML 拆分為多個部分並根據指定模式提取頁面所需的所有功能。這是一個獨立的 C++ 解決方案,不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。
使用 C++ 代碼中的不同標準拆分 HTML 內容。您可以對 HTML 文件使用以下頁面提取模式:"按標題拆分"、"按節拆分"、"按頁拆分"、"按頁面範圍拆分"。
將文件 HTML 為多個部分後,您可以使用 'Document.Save' 方法將結果導出為所需的文件格式。您還可以使用 'DocumentPartSavingCallback' 屬性控制 HTML 部分如何導出到 HTML 或 EPUB,這將允許您重定向輸出流。
使用我們的 C++ 解決方案輕鬆拆分文檔 HTML C++ 。以下示例顯示如何使用 C++ 拆分 HTML C++:
dotnet add package Aspose.Words.Cpp
複製
using namespace Aspose::Words;
auto doc = MakeObject<Document>(u"Input.html");
for (int page = 0; page < doc->get_PageCount(); page++)
{
auto extractedPage = doc->ExtractPages(page, 1);
extractedPage->Save(String::Format(u"Output_{0}.html", page + 1));
}
有三個選項可以將 Aspose.Words for C++ 安裝到您的開發人員環境中。請選擇符合您需求的一種,並按照分步說明進行操作:
您可以使用這個 C++ 庫在 Microsoft Windows 、Linux 和 macOS 操作系統上開發軟件:
如果您為 Linux 或 macOS 開發軟件,請查看產品文檔中 fontconfig 和 mesa-glu 開源包)的信息。