Rozdeliť HTML na časti v Python

Rýchla knižnica Python na rozdelenie jedného HTML súboru do skupiny menších súborov podľa daných kritérií

Použite knižnicu Python via .NET na rozdelenie HTML súborov na časti. Extrahované stránky HTML môžete integrovať s inými údajmi a v dôsledku toho získať dokumenty vo forme a obsahu, ktoré požadujete. Rozdelenie HTML na časti uľahčuje spoluprácu na HTML súboroch.

Zobraziť útržok kódu

Rozdeľte HTML pomocou Python

Táto softvérová knižnica poskytuje vývojárom Python sadu funkcií na rozdelenie HTML súborov na časti. Rozdelenie HTML do samostatných súborov sa môže použiť na uľahčenie paralelnej práce s časťami dokumentu. Ak napríklad na jednom HTML pracuje niekoľko ľudí súčasne, rozdelenie HTML im umožní urýchliť prácu. Rozdelenie HTML môže byť súčasťou technológie na extrakciu textu zo HTML súborov a integráciu údajov do automatizovaných informačných systémov alebo databáz.

Naša knižnica poskytuje vývojárom Python všetky potrebné funkcie na rozdelenie HTML na časti a extrahovanie stránok podľa určeného režimu. Toto je samostatné riešenie Python via .NET, ktoré nevyžaduje nainštalované aplikácie Microsoft Word, Acrobat Reader ani iné aplikácie.

Rozdeľte HTML súbor na časti v Python kóde

Rozdeľte obsah HTML pomocou rôznych kritérií v Python kóde. Pre HTML súbory môžete použiť nasledujúce režimy extrakcie stránok: 'rozdelenie podľa nadpisov', 'rozdelenie podľa sekcií', 'rozdelenie strany po stránke', 'rozdelenie podľa rozsahov strán'.

Po rozdelení HTML súboru na časti môžete výsledok exportovať do požadovaného formátu súboru pomocou metódy 'Document.Save'. Môžete tiež ovládať, ako sa časti HTML exportujú do HTML alebo EPUB pomocou vlastnosti 'DocumentPartSavingCallback', ktorá vám umožní presmerovať výstupné toky.

Rozdeľte HTML dokumenty jednoducho pomocou nášho riešenia pre Python via .NET. Nasledujúci príklad ukazuje, ako rozdeliť HTML pomocou Python:

Príklad Python kódu na rozdelenie HTML súboru
Nahrajte súbor, ktorý chcete rozdeliť
Spustiť kód
Vyberte cieľový formát zo zoznamu
pip install aspose-words
Kopírovať
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Spustiť kód

Ako rozdeliť HTML v Python

  1. Nainštalujte si knižnicu Python, aby ste mohli programovo rozdeliť HTML súborov.
  2. Pridajte odkaz na knižnicu (importujte knižnicu) do svojho Python projektu.
  3. Otvorte HTML v Python.
  4. Ak chcete extrahovať konkrétne stránky z HTML, zavolajte metódu extract_pages().
  5. Získajte výsledok rozdelenia HTML ako samostatné súbory.

Knižnica Python na rozdelenie HTML dokumentov

Naše balíčky Python hostíme v úložiskách PyPi. Postupujte podľa podrobných pokynov, ako nainštalovať "Aspose.Words for Python via .NET" do vášho vývojárskeho prostredia.

Požiadavky na systém

Tento balík je kompatibilný s Python ≥3.5 a <3.12. Ak vyvíjate softvér pre Linux, pozrite si ďalšie požiadavky pre gcc a libpython v dokumentácii k produktu.

Ďalšie podporované operácie rozdelenia: HTML

Súbor HTML môžete rozdeliť aj na iné formáty súborov:

5%

Prihláste sa na odber aktualizácií produktov Aspose

Získajte mesačné bulletiny a ponuky priamo do vašej poštovej schránky.

© Aspose Pty Ltd 2001-2024. Všetky práva vyhradené.