Используйте Python via .NET библиотеку для разделения HTML файлов на части. Вы можете интегрировать извлеченные HTML страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение HTML на части упрощает совместную работу над HTML файлами.
Эта программная библиотека предоставляет Python разработчикам набор функций для разделения HTML файлов на части. Разделение HTML на отдельные файлы может использоваться для распараллеливания работы с разделами документа. Например, если над одним HTML документом работают несколько человек одновременно, то разделение HTML позволит им ускорить работу. Разделение HTML может быть частью технологии извлечения текста из HTML файлов и интеграции данных в автоматизированные информационные системы или базы данных.
Python библиотека предоставляет разработчикам все необходимые функции для разделения HTML на части и извлечения страниц в соответствии с заданным режимом. Это автономное решение для Python via .NET, которое не требует установки офисных пакетов Microsoft Word, Acrobat Reader или других приложений.
Разделите содержимое HTML разными способами на Python. Вы можете использовать следующие режимы извлечения страниц для HTML файлов: 'разделить по заголовкам', 'разделить по разделам', 'разделить страницу за страницей', 'разделить по диапазонам страниц'.
После разделения вашего HTML файла на части вы можете экспортировать результат в нужный формат, вызвав метод 'Document.Save'. Вы также можете управлять тем, каким образом части HTML экспортируются в HTML форматы или EPUB, используя свойство 'DocumentPartSavingCallback', которое также позволит вам перенаправлять потоки вывода.
Легко разделяйте HTML документы с помощью нашего решения для Python via .NET. В следующем примере показано, как разделить HTML на Python:
pip install aspose-words
Копировать
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Мы размещаем наши пакеты Python в репозиториях PyPi. Следуйте пошаговым инструкциям по установке "Aspose.Words for Python via .NET" в среду разработчика.
Этот пакет совместим с Python ≥3.5 и <3.12. Если вы разрабатываете программное обеспечение для Linux, ознакомьтесь с дополнительными требованиями для gcc и libpython в документации по продукту.