將 HTML 拆分為 C++ 中的部分

快速 C++ 庫,用於根據給定條件將一個 HTML 文件拆分為一組較小的文件。

使用 C++ 庫將 HTML 文件拆分為多個部分。您可以將提取的 HTML 頁面與其他數據集成,從而獲得所需形式和內容的文檔。將 HTML 拆分為多個部分可以更輕鬆地協作處理 HTML 文件。

查看代碼片段

使用 C++ 拆分 HTML

該軟件庫為 C++ 開發人員提供了一組函數來將文件 HTML 拆分為多個部分。將 HTML 拆分為單獨的文件可用於更輕鬆地並行處理文檔的各個部分。例如,如果幾個人同時在一個 HTML 上工作,那麼拆分 HTML 可以讓他們加快工作速度。拆分 HTML 可能是從文件 HTML 中提取文本並將數據集成到自動化信息系統或數據庫中的技術的一部分。

我們的庫為 C++ 開發人員提供了將 HTML 拆分為多個部分並根據指定模式提取頁面所需的所有功能。這是一個獨立的 C++ 解決方案,不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。

將文件 HTML 拆分為代碼 C++ 中的部分

使用 C++ 代碼中的不同標準拆分 HTML 內容。您可以對 HTML 文件使用以下頁面提取模式:"按標題拆分"、"按節拆分"、"按頁拆分"、"按頁面範圍拆分"。

將文件 HTML 為多個部分後,您可以使用 'Document.Save' 方法將結果導出為所需的文件格式。您還可以使用 'DocumentPartSavingCallback' 屬性控制 HTML 部分如何導出到 HTML 或 EPUB,這將允許您重定向輸出流。

使用我們的 C++ 解決方案輕鬆拆分文檔 HTML C++ 。以下示例顯示如何使用 C++ 拆分 HTML C++:

C++ 用於拆分 HTML 文件的代碼示例
上傳要拆分的文件
運行代碼
從列表中選擇目標格式
dotnet add package Aspose.Words.Cpp
複製
using namespace Aspose::Words;

auto doc = MakeObject<Document>(u"Input.html");

for (int page = 0; page < doc->get_PageCount(); page++)
{
    auto extractedPage = doc->ExtractPages(page, 1);
    extractedPage->Save(String::Format(u"Output_{0}.html", page + 1));
}
運行代碼

如何將 HTML 拆分為 C++

  1. 安裝 C++ 庫以編程方式拆分 HTML 文件。
  2. 將庫引用(導入庫)添加到您的 C++ 項目。
  3. 在 C++ 中打開 HTML。
  4. 調用ExtractPages()方法從 HTML 中提取特定頁面。
  5. 獲取 HTML 拆分為單獨文件的結果。

C++ 個庫來拆分 HTML 個文檔

有三個選項可以將 Aspose.Words for C++ 安裝到您的開發人員環境中。請選擇符合您需求的一種,並按照分步說明進行操作:

系統要求

您可以使用這個 C++ 庫在 Microsoft Windows 、Linux 和 macOS 操作系統上開發軟件:

  • Linux 需要 GCC >= 6.3.0 和 Clang >= 3.9.1
  • Xcode >= 12.5.1 ,macOS 需要 Clang 和 libc++

如果您為 Linux 或 macOS 開發軟件,請查看產品文檔中 fontconfig 和 mesa-glu 開源包)的信息。

其他支持的 HTML 拆分操作

您還可以將 HTML 拆分為其他文件格式:

5%

訂閱 Aspose 產品更新

獲取直接發送到您的郵箱的每月通訊和優惠。

© Aspose Pty Ltd 2001-2024. 版權所有。