Rozdělit HTML na části v Python

Rychlá knihovna Python pro rozdělení jednoho HTML souboru do skupiny menších souborů podle daných kritérií

Použijte knihovnu Python via .NET k rozdělení HTML souborů na části. Extrahované stránky HTML můžete integrovat s jinými daty a v důsledku toho získat dokumenty ve formě a obsahu, které požadujete. Rozdělení HTML na části usnadňuje spolupráci na HTML souborech.

Zobrazit fragment kódu

Rozdělit HTML pomocí Python

Tato softwarová knihovna poskytuje vývojářům Python sadu funkcí pro rozdělení HTML souborů na části. Rozdělení HTML do samostatných souborů lze použít k usnadnění paralelní práce s částmi dokumentu. Pokud například na jednom HTML pracuje několik lidí současně, rozdělení HTML jim umožní urychlit práci. Rozdělení HTML může být součástí technologie pro extrakci textu ze HTML souborů a integraci dat do automatizovaných informačních systémů nebo databází.

Naše knihovna poskytuje vývojářům Python všechny potřebné funkce k rozdělení HTML na části a extrahování stránek podle zadaného režimu. Toto je samostatné řešení Python via .NET, které nevyžaduje instalaci aplikací Microsoft Word, Acrobat Reader nebo jiné aplikace.

Rozdělte HTML soubor na části v Python kódu

Rozdělte obsah HTML pomocí různých kritérií v Python kódu. Pro HTML soubory můžete použít následující režimy extrakce stránky: 'rozdělit podle nadpisů', 'rozdělit podle sekcí', 'rozdělit stránku po stránce', 'rozdělit podle rozsahů stránek'.

Po rozdělení HTML souboru na části můžete výsledek exportovat do požadovaného formátu souboru pomocí metody 'Document.Save'. Můžete také ovládat, jak se části HTML exportují do HTML nebo EPUB pomocí vlastnosti 'DocumentPartSavingCallback', která vám umožní přesměrovat výstupní proudy.

Rozdělte HTML dokumenty snadno pomocí našeho řešení pro Python via .NET. Následující příklad ukazuje, jak rozdělit HTML pomocí Python:

Příklad Python kódu pro rozdělení HTML souboru
Nahrajte soubor, který chcete rozdělit
Spustit kód
Vyberte cílový formát ze seznamu
pip install aspose-words
Kopírovat
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Spustit kód

Jak rozdělit HTML v Python

  1. Chcete-li programově rozdělit HTML souborů, nainstalujte si knihovnu Python.
  2. Přidejte odkaz na knihovnu (importujte knihovnu) do svého Python projektu.
  3. Otevřete HTML v Python.
  4. Chcete-li extrahovat konkrétní stránky z HTML, zavolejte metodu extract_pages().
  5. Získejte výsledek rozdělení HTML jako samostatné soubory.

Knihovna Python k rozdělení HTML dokumentů

Naše balíčky Python hostujeme v úložištích PyPi. Postupujte prosím podle pokynů krok za krokem, jak nainstalovat "Aspose.Words for Python via .NET" do vašeho vývojářského prostředí.

Požadavky na systém

Tento balíček je kompatibilní s Python ≥3.5 a <3.12. Pokud vyvíjíte software pro Linux, podívejte se prosím na další požadavky pro gcc a libpython v dokumentaci k produktu.

Další podporované operace rozdělení HTML

Soubor HTML můžete také rozdělit do jiných formátů souborů:

5%

Přihlaste se k odběru aktualizací produktu Aspose

Získejte měsíční zpravodaje a nabídky přímo do vaší poštovní schránky.

© Aspose Pty Ltd 2001-2024. Všechna práva vyhrazena.