Използвайте Python via .NET библиотека, за да разделите HTML файлове на части. Можете да интегрирате извлечените HTML страници с други данни и в резултат на това да получите документи с формата и съдържанието, от които се нуждаете. Разделянето на HTML на части улеснява съвместната работа върху HTML файлове.
Тази софтуерна библиотека предоставя на разработчиците на Python набор от функции за разделяне на HTML файлове на части. Разделянето на HTML на отделни файлове може да се използва, за да се улесни паралелната работа с раздели от документ. Например, ако няколко души работят върху един HTML едновременно, тогава разделянето на HTML ще им позволи да ускорят работата. Разделянето на HTML може да бъде част от технология за извличане на текст от HTML файлове и интегриране на данни в автоматизирани информационни системи или бази данни.
Нашата библиотека предоставя на разработчиците на Python всички необходими функции за разделяне на HTML на части и извличане на страници според посочения режим. Това е самостоятелно решение Python via .NET, което не изисква инсталирани Microsoft Word, Acrobat Reader или други приложения.
Разделете HTML съдържание, като използвате различни критерии в кода Python. Можете да използвате следните режими на извличане на страници за HTML файлове: 'разделяне по заглавия', 'разделяне по секции', 'разделяне на страница по страница', 'разделяне по диапазони на страници'.
След като разделите вашия HTML файл на части, можете да експортирате резултата в необходимия файлов формат, като използвате метода 'Document.Save'. Можете също да контролирате как частите HTML се експортират в HTML или EPUB, като използвате свойството 'DocumentPartSavingCallback', което ще ви позволи да пренасочвате изходни потоци.
Разделяйте HTML документи лесно с нашето решение за Python via .NET. Следният пример показва как да разделите HTML с помощта на Python:
pip install aspose-words
копие
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Ние хостваме нашите Python пакети в хранилища на PyPi. Моля, следвайте инструкциите стъпка по стъпка как да инсталирате "Aspose.Words for Python via .NET" във вашата среда за разработчици.
Този пакет е съвместим с Python ≥3.5 и <3.12. Ако разработвате софтуер за Linux, моля, разгледайте допълнителните изисквания за gcc и libpython в продуктовата документация.