Padalinkite dokumentus į dalis Python

Greita Python biblioteka, skirta padalyti dokumentą į mažesnių failų grupę pagal nurodytus kriterijus

Naudokite Python biblioteką, kad padalintumėte dokumentus į dalis. Galite integruoti ištrauktus puslapius su kitais duomenimis ir gauti reikiamos formos bei turinio dokumentus. Suskaidžius dokumentus į dalis, lengviau bendradarbiauti su jais.

Peržiūrėkite kodo fragmentą

Padalinkite Word, PDF naudodami Python

Ši programinės įrangos biblioteka suteikia Python kūrėjams funkcijų rinkinį, skirtą padalyti Word, PDF, EPUB, HTML, DOCX dokumentus į dalis. Kad būtų lengviau dirbti su dokumentų skyriais, galima padalyti tekstą į atskirus failus. Dokumentų skaidymo procedūra gali būti duomenų integravimo į automatizuotas informacines sistemas ar duomenų bazes technologijos dalis.

Mūsų Python biblioteka kūrėjams suteikia visas reikalingas funkcijas dokumentams ir dokumentų puslapių ištraukimui pagal nurodytą režimą. Tai yra atskiras Python via .NET sprendimas, kuriam nereikia įdiegti Microsoft Word, Acrobat Reader ar kitų programų.

Padalinkite dokumentą į dalis naudodami Python

Padalinkite dokumento turinį naudodami skirtingus Python kode kriterijus. Galite naudoti šiuos puslapių ištraukimo režimus: "suskirstyti pagal antraštes", "padalyti pagal skyrius", "padalyti puslapį pagal puslapį", "padalyti pagal puslapių diapazonus".

Išskaidę dokumentą, rezultatą galite eksportuoti į reikiamą failo formatą naudodami 'Document.Save' metodą. Taip pat galite valdyti, kaip dokumento dalys eksportuojamos į HTML arba EPUB formatus, naudodami nuosavybę 'DocumentPartSavingCallback', kuri leis nukreipti išvesties srautus.

Lengvai padalinkite dokumentus naudodami Python via .NET sprendimą. Šiame pavyzdyje parodyta, kaip padalinti dokumentą naudojant Python:

Kodo pavyzdys Python, skirtas padalyti dokumentą į dalis
Įkelkite failą, kurį norite padalyti
Vykdyti kodą
Iš sąrašo pasirinkite tikslinį formatą
pip install aspose-words
Kopijuoti
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Vykdyti kodą

Kaip padalinti Word, PDF, HTML ir kitus failų formatus Python

  1. Įdiekite Python biblioteką, kad galėtumėte programiškai padalinti dokumentus.
  2. Pridėkite bibliotekos nuorodą (importuokite biblioteką) prie savo Python projekto.
  3. Atidarykite šaltinio dokumentą Python.
  4. Iškvieskite metodą extract_pages(), kad ištrauktumėte konkrečius puslapius iš savo dokumento.
  5. Gaukite dokumentų padalijimo rezultatą kaip atskirus failus.

Python biblioteka failams padalinti

Python paketus talpiname PyPi saugyklose. Vadovaukitės nuosekliomis instrukcijomis, kaip įdiegti "Aspose.Words for Python via .NET" į kūrėjo aplinką.

Sistemos reikalavimai

Šis paketas suderinamas su Python ≥3.5 ir <3.12. Jei kuriate programinę įrangą, skirtą Linux, peržiūrėkite papildomus gcc ir libpython reikalavimus produkto dokumentacijoje.

Populiariausi failų formatai skaidymui

5%

Prenumeruokite "Aspose" produktų naujinius

Gaukite mėnesinius naujienlaiškius ir pasiūlymus, pristatomus tiesiai į jūsų pašto dėžutę.

© Aspose Pty Ltd 2001-2024. Visos teisės saugomos.