Razdelite dokumente na dele v Python

Hitra Python knjižnica za razdelitev dokumenta v skupino manjših datotek v skladu z danimi kriteriji

Uporabite knjižnico Python za razdelitev dokumentov na dele. Izvlečene strani lahko integrirate z drugimi podatki in posledično dobite dokumente oblike in vsebine, ki jih potrebujete. Če dokumente razdelite na dele, je lažje sodelovanje pri njih.

Oglejte si delček kode

Razdelite Word, PDF z uporabo Python

Ta knjižnica programske opreme razvijalcem Python ponuja nabor funkcij za razdelitev Word dokumentov, PDF, EPUB, HTML, DOCX na dele. Razdelitev besedila v ločene datoteke se lahko uporabi za lažje delo z odseki dokumentov. Postopek delitve dokumentov je lahko del tehnologije integracije podatkov v avtomatizirane informacijske sisteme ali baze podatkov.

Naša knjižnica ponuja razvijalcem Python vse potrebne funkcije za dokumente in ekstrahiranje strani dokumentov v skladu z določenim načinom. To je samostojna rešitev Python via .NET, ki ne potrebuje nameščenih Microsoft Word, Acrobat Reader ali drugih aplikacij.

Razdelite dokument na dele z uporabo Python

Razdelite vsebino dokumenta z različnimi merili v Python kodi. Uporabite lahko naslednje načine ekstrakcije strani: 'razdeli po naslovih', 'razdeli po odsekih', 'razdeli stran za stranjo', 'razdeli po obsegih strani'.

Po razdelitvi dokumenta lahko rezultat izvozite v zahtevano obliko datoteke z metodo 'Document.Save'. Prav tako lahko nadzirate, kako se deli dokumenta izvažajo v HTML formate ali EPUB z lastnostjo 'DocumentPartSavingCallback', ki vam bo omogočila preusmeritev izhodnih tokov.

Preprosto razdelite dokumente z našo rešitvijo za Python via .NET. Naslednji primer prikazuje, kako razdeliti dokument z uporabo Python:

Primer kode v Python za razdelitev dokumenta na dele
Naložite datoteko, ki jo želite razdeliti
Zaženi kodo
S seznama izberite ciljno obliko
pip install aspose-words
Kopirati
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Zaženi kodo

Kako razdeliti Word, PDF, HTML in druge oblike datotek v Python

  1. Namestite knjižnico Python za programsko razdelitev dokumentov.
  2. Dodajte referenco knjižnice (uvozite knjižnico) svojemu Python projektu.
  3. Odprite izvorni dokument v Python.
  4. Pokličite metodo extract_pages(), da izvlecite določene strani iz dokumenta.
  5. Pridobite rezultat razdelitve dokumenta kot ločene datoteke.

Python knjižnica za razdelitev datotek

Naše pakete Python gostimo v repozitorijih PyPi. Sledite navodilom po korakih, kako namestiti "Aspose.Words for Python via .NET" v okolje razvijalca.

Sistemske zahteve

Ta paket je združljiv s Python ≥3.5 in <3.12. Če razvijate programsko opremo za Linux, si oglejte dodatne zahteve za gcc in libpython v dokumentaciji izdelka.

Najbolj priljubljeni formati datotek za razdelitev

5%

Naročite se na posodobitve izdelkov Aspose

Prejemajte mesečna glasila in ponudbe neposredno v vaš nabiralnik.

© Aspose Pty Ltd 2001-2024. Vse pravice pridržane.