Použite knižnicu Python via .NET na rozdelenie HTML súborov na časti. Extrahované stránky HTML môžete integrovať s inými údajmi a v dôsledku toho získať dokumenty vo forme a obsahu, ktoré požadujete. Rozdelenie HTML na časti uľahčuje spoluprácu na HTML súboroch.
Táto softvérová knižnica poskytuje vývojárom Python sadu funkcií na rozdelenie HTML súborov na časti. Rozdelenie HTML do samostatných súborov sa môže použiť na uľahčenie paralelnej práce s časťami dokumentu. Ak napríklad na jednom HTML pracuje niekoľko ľudí súčasne, rozdelenie HTML im umožní urýchliť prácu. Rozdelenie HTML môže byť súčasťou technológie na extrakciu textu zo HTML súborov a integráciu údajov do automatizovaných informačných systémov alebo databáz.
Naša knižnica poskytuje vývojárom Python všetky potrebné funkcie na rozdelenie HTML na časti a extrahovanie stránok podľa určeného režimu. Toto je samostatné riešenie Python via .NET, ktoré nevyžaduje nainštalované aplikácie Microsoft Word, Acrobat Reader ani iné aplikácie.
Rozdeľte obsah HTML pomocou rôznych kritérií v Python kóde. Pre HTML súbory môžete použiť nasledujúce režimy extrakcie stránok: 'rozdelenie podľa nadpisov', 'rozdelenie podľa sekcií', 'rozdelenie strany po stránke', 'rozdelenie podľa rozsahov strán'.
Po rozdelení HTML súboru na časti môžete výsledok exportovať do požadovaného formátu súboru pomocou metódy 'Document.Save'. Môžete tiež ovládať, ako sa časti HTML exportujú do HTML alebo EPUB pomocou vlastnosti 'DocumentPartSavingCallback', ktorá vám umožní presmerovať výstupné toky.
Rozdeľte HTML dokumenty jednoducho pomocou nášho riešenia pre Python via .NET. Nasledujúci príklad ukazuje, ako rozdeliť HTML pomocou Python:
pip install aspose-words
Kopírovať
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Naše balíčky Python hostíme v úložiskách PyPi. Postupujte podľa podrobných pokynov, ako nainštalovať "Aspose.Words for Python via .NET" do vášho vývojárskeho prostredia.
Tento balík je kompatibilný s Python ≥3.5 a <3.12. Ak vyvíjate softvér pre Linux, pozrite si ďalšie požiadavky pre gcc a libpython v dokumentácii k produktu.