Použijte knihovnu Python via .NET k rozdělení HTML souborů na části. Extrahované stránky HTML můžete integrovat s jinými daty a v důsledku toho získat dokumenty ve formě a obsahu, které požadujete. Rozdělení HTML na části usnadňuje spolupráci na HTML souborech.
Tato softwarová knihovna poskytuje vývojářům Python sadu funkcí pro rozdělení HTML souborů na části. Rozdělení HTML do samostatných souborů lze použít k usnadnění paralelní práce s částmi dokumentu. Pokud například na jednom HTML pracuje několik lidí současně, rozdělení HTML jim umožní urychlit práci. Rozdělení HTML může být součástí technologie pro extrakci textu ze HTML souborů a integraci dat do automatizovaných informačních systémů nebo databází.
Naše knihovna poskytuje vývojářům Python všechny potřebné funkce k rozdělení HTML na části a extrahování stránek podle zadaného režimu. Toto je samostatné řešení Python via .NET, které nevyžaduje instalaci aplikací Microsoft Word, Acrobat Reader nebo jiné aplikace.
Rozdělte obsah HTML pomocí různých kritérií v Python kódu. Pro HTML soubory můžete použít následující režimy extrakce stránky: 'rozdělit podle nadpisů', 'rozdělit podle sekcí', 'rozdělit stránku po stránce', 'rozdělit podle rozsahů stránek'.
Po rozdělení HTML souboru na části můžete výsledek exportovat do požadovaného formátu souboru pomocí metody 'Document.Save'. Můžete také ovládat, jak se části HTML exportují do HTML nebo EPUB pomocí vlastnosti 'DocumentPartSavingCallback', která vám umožní přesměrovat výstupní proudy.
Rozdělte HTML dokumenty snadno pomocí našeho řešení pro Python via .NET. Následující příklad ukazuje, jak rozdělit HTML pomocí Python:
pip install aspose-words
Kopírovat
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Naše balíčky Python hostujeme v úložištích PyPi. Postupujte prosím podle pokynů krok za krokem, jak nainstalovat "Aspose.Words for Python via .NET" do vašeho vývojářského prostředí.
Tento balíček je kompatibilní s Python ≥3.5 a <3.12. Pokud vyvíjíte software pro Linux, podívejte se prosím na další požadavky pro gcc a libpython v dokumentaci k produktu.