Разделить HTML на части, используя C++

Быстрая C++ библиотека для разделения одного HTML файла на группу файлов меньшего размера в соответствии с заданными критериями

Используйте C++ библиотеку для разделения HTML файлов на части. Вы можете интегрировать извлеченные HTML страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение HTML на части упрощает совместную работу над HTML файлами.

Посмотреть фрагмент кода

Разделить HTML с помощью C++

Эта программная библиотека предоставляет C++ разработчикам набор функций для разделения HTML файлов на части. Разделение HTML на отдельные файлы может использоваться для распараллеливания работы с разделами документа. Например, если над одним HTML документом работают несколько человек одновременно, то разделение HTML позволит им ускорить работу. Разделение HTML может быть частью технологии извлечения текста из HTML файлов и интеграции данных в автоматизированные информационные системы или базы данных.

C++ библиотека предоставляет разработчикам все необходимые функции для разделения HTML на части и извлечения страниц в соответствии с заданным режимом. Это автономное решение для C++, которое не требует установки офисных пакетов Microsoft Word, Acrobat Reader или других приложений.

Разбить HTML файл на части в коде C++

Разделите содержимое HTML разными способами на C++. Вы можете использовать следующие режимы извлечения страниц для HTML файлов: 'разделить по заголовкам', 'разделить по разделам', 'разделить страницу за страницей', 'разделить по диапазонам страниц'.

После разделения вашего HTML файла на части вы можете экспортировать результат в нужный формат, вызвав метод 'Document.Save'. Вы также можете управлять тем, каким образом части HTML экспортируются в HTML форматы или EPUB, используя свойство 'DocumentPartSavingCallback', которое также позволит вам перенаправлять потоки вывода.

Легко разделяйте HTML документы с помощью нашего решения для C++. В следующем примере показано, как разделить HTML на C++:

Пример C++ кода для разделения HTML файла
Загрузите файл, который хотите разделить
Выполнить код
Выберите целевой формат из списка
dotnet add package Aspose.Words.Cpp
Копировать
using namespace Aspose::Words;

auto doc = MakeObject<Document>(u"Input.html");

for (int page = 0; page < doc->get_PageCount(); page++)
{
    auto extractedPage = doc->ExtractPages(page, 1);
    extractedPage->Save(String::Format(u"Output_{0}.html", page + 1));
}
Выполнить код

Как разделить HTML на части C++

  1. Установите C++ библиотеку для программного разделения HTML файлов.
  2. Добавьте ссылку на библиотеку (импортируйте библиотеку) в свой C++ проект.
  3. Откройте HTML на C++.
  4. Вызовите метод ExtractPages(), чтобы извлечь определенные страницы из HTML.
  5. Получите результат разделения HTML на отдельные файлы.

C++ библиотека для разделения HTML документов

Есть три варианта установки Aspose.Words for C++ в среду разработчика. Пожалуйста, выберите тот, который соответствует вашим потребностям, и следуйте пошаговым инструкциям:

Системные Требования

Вы можете использовать эту библиотеку C++ для разработки программного обеспечения в Microsoft Windows, Linux и macOS:

  • Для Linux требуются GCC >= 6.3.0 и Clang >= 3.9.1
  • Xcode >= 12.5.1, для macOS требуются Clang и libc++

Если вы разрабатываете программное обеспечение для Linux или macOS, проверьте информацию о зависимостях дополнительных библиотек (fontconfig и пакеты с открытым исходным кодом mesa-glu) в документации по продукту.

Другие поддерживаемые HTML операции разделения

Вы также можете разделить HTML на файлы других форматов:

5%

Подпишитесь на обновления продукта Aspose

Получайте ежемесячные информационные бюллетени и предложения, доставляемые прямо на ваш почтовый ящик.