Uporabite knjižnico Python za razdelitev dokumentov na dele. Izvlečene strani lahko integrirate z drugimi podatki in posledično dobite dokumente oblike in vsebine, ki jih potrebujete. Če dokumente razdelite na dele, je lažje sodelovanje pri njih.
Ta knjižnica programske opreme razvijalcem Python ponuja nabor funkcij za razdelitev Word dokumentov, PDF, EPUB, HTML, DOCX na dele. Razdelitev besedila v ločene datoteke se lahko uporabi za lažje delo z odseki dokumentov. Postopek delitve dokumentov je lahko del tehnologije integracije podatkov v avtomatizirane informacijske sisteme ali baze podatkov.
Naša knjižnica ponuja razvijalcem Python vse potrebne funkcije za dokumente in ekstrahiranje strani dokumentov v skladu z določenim načinom. To je samostojna rešitev Python via .NET, ki ne potrebuje nameščenih Microsoft Word, Acrobat Reader ali drugih aplikacij.
Razdelite vsebino dokumenta z različnimi merili v Python kodi. Uporabite lahko naslednje načine ekstrakcije strani: 'razdeli po naslovih', 'razdeli po odsekih', 'razdeli stran za stranjo', 'razdeli po obsegih strani'.
Po razdelitvi dokumenta lahko rezultat izvozite v zahtevano obliko datoteke z metodo 'Document.Save'. Prav tako lahko nadzirate, kako se deli dokumenta izvažajo v HTML formate ali EPUB z lastnostjo 'DocumentPartSavingCallback', ki vam bo omogočila preusmeritev izhodnih tokov.
Preprosto razdelite dokumente z našo rešitvijo za Python via .NET. Naslednji primer prikazuje, kako razdeliti dokument z uporabo Python:
pip install aspose-words
Kopirati
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
Ta paket je združljiv s Python ≥3.5 in <3.12. Če razvijate programsko opremo za Linux, si oglejte dodatne zahteve za gcc in libpython v dokumentaciji izdelka.