Разделить HTML на части, используя Python

Быстрая Python библиотека для разделения одного HTML файла на группу файлов меньшего размера в соответствии с заданными критериями

Используйте Python via .NET библиотеку для разделения HTML файлов на части. Вы можете интегрировать извлеченные HTML страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение HTML на части упрощает совместную работу над HTML файлами.

Посмотреть фрагмент кода

Разделить HTML с помощью Python

Эта программная библиотека предоставляет Python разработчикам набор функций для разделения HTML файлов на части. Разделение HTML на отдельные файлы может использоваться для распараллеливания работы с разделами документа. Например, если над одним HTML документом работают несколько человек одновременно, то разделение HTML позволит им ускорить работу. Разделение HTML может быть частью технологии извлечения текста из HTML файлов и интеграции данных в автоматизированные информационные системы или базы данных.

Python библиотека предоставляет разработчикам все необходимые функции для разделения HTML на части и извлечения страниц в соответствии с заданным режимом. Это автономное решение для Python via .NET, которое не требует установки офисных пакетов Microsoft Word, Acrobat Reader или других приложений.

Разбить HTML файл на части в коде Python

Разделите содержимое HTML разными способами на Python. Вы можете использовать следующие режимы извлечения страниц для HTML файлов: 'разделить по заголовкам', 'разделить по разделам', 'разделить страницу за страницей', 'разделить по диапазонам страниц'.

После разделения вашего HTML файла на части вы можете экспортировать результат в нужный формат, вызвав метод 'Document.Save'. Вы также можете управлять тем, каким образом части HTML экспортируются в HTML форматы или EPUB, используя свойство 'DocumentPartSavingCallback', которое также позволит вам перенаправлять потоки вывода.

Легко разделяйте HTML документы с помощью нашего решения для Python via .NET. В следующем примере показано, как разделить HTML на Python:

Пример Python кода для разделения HTML файла
Загрузите файл, который хотите разделить
Выполнить код
Выберите целевой формат из списка
pip install aspose-words
Копировать
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Выполнить код

Как разделить HTML на части Python

  1. Установите Python библиотеку для программного разделения HTML файлов.
  2. Добавьте ссылку на библиотеку (импортируйте библиотеку) в свой Python проект.
  3. Откройте HTML на Python.
  4. Вызовите метод extract_pages(), чтобы извлечь определенные страницы из HTML.
  5. Получите результат разделения HTML на отдельные файлы.

Python библиотека для разделения HTML документов

Мы размещаем наши пакеты Python в репозиториях PyPi. Следуйте пошаговым инструкциям по установке "Aspose.Words for Python via .NET" в среду разработчика.

Системные Требования

Этот пакет совместим с Python ≥3.5 и <3.12. Если вы разрабатываете программное обеспечение для Linux, ознакомьтесь с дополнительными требованиями для gcc и libpython в документации по продукту.

Другие поддерживаемые HTML операции разделения

Вы также можете разделить HTML на файлы других форматов:

5%

Подпишитесь на обновления продукта Aspose

Получайте ежемесячные информационные бюллетени и предложения, доставляемые прямо на ваш почтовый ящик.