Uporabite knjižnico Python via .NET za razdelitev HTML datotek na dele. Izvlečene strani HTML lahko integrirate z drugimi podatki in posledično dobite dokumente oblike in vsebine, ki jih potrebujete. Če razdelite HTML na dele, je lažje sodelovanje pri HTML datotekah.
Ta knjižnica programske opreme razvijalcem Python ponuja nabor funkcij za razdelitev HTML datotek na dele. Razdelitev HTML v ločene datoteke lahko uporabite za lažje vzporedno delo z odseki dokumenta. Na primer, če več ljudi hkrati dela na enem HTML, jim bo z razdelitvijo HTML omogočilo pospešitev dela. Razdelitev HTML je lahko del tehnologije za ekstrakcijo besedila iz HTML datotek in integracijo podatkov v avtomatizirane informacijske sisteme ali baze podatkov.
Naša knjižnica ponuja razvijalcem Python vse potrebne funkcije za razdelitev HTML na dele in ekstrakcijo strani v skladu z določenim načinom. To je samostojna rešitev Python via .NET, za katero ni treba namestiti Microsoft Word, Acrobat Readerja ali drugih aplikacij.
Razdelite vsebino HTML z različnimi merili v Python kodi. Za HTML datoteke lahko uporabite naslednje načine ekstrakcije strani: 'razdeli po naslovih', 'razdeli po odsekih', 'razdeli stran za stranjo', 'razdeli po obsegih strani'.
Ko svojo HTML datoteko na dele, lahko izvozite rezultat v zahtevano obliko datoteke z metodo 'Document.Save'. Prav tako lahko nadzirate, kako se deli HTML izvozijo v HTML ali EPUB z lastnostjo 'DocumentPartSavingCallback', ki vam bo omogočila preusmeritev izhodnih tokov.
Preprosto razdelite HTML dokumente z našo rešitvijo za Python via .NET. Naslednji primer prikazuje, kako razdeliti HTML z uporabo Python:
pip install aspose-words
Kopirati
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Ta paket je združljiv s Python ≥3.5 in <3.12. Če razvijate programsko opremo za Linux, si oglejte dodatne zahteve za gcc in libpython v dokumentaciji izdelka.