Sadaliet dokumentus daļās Python

Ātra Python bibliotēka, lai sadalītu dokumentu mazāku failu grupā atbilstoši norādītajiem kritērijiem

Izmantojiet Python bibliotēku, lai sadalītu dokumentus daļās. Jūs varat integrēt izvilktās lapas ar citiem datiem un rezultātā iegūt jums nepieciešamās formas un satura dokumentus. Dokumentu sadalīšana daļās atvieglo sadarbību ar tiem.

Skatīt koda fragmentu

Sadaliet Word, PDF, izmantojot Python

Šī programmatūras bibliotēka nodrošina Python izstrādātājus ar funkciju kopumu, lai sadalītu Word, PDF, EPUB, HTML, DOCX dokumentus daļās. Lai atvieglotu darbu ar dokumentu sadaļām, var izmantot teksta sadalīšanu atsevišķos failos. Dokumentu sadalīšanas procedūra var būt daļa no tehnoloģijas datu integrēšanai automatizētās informācijas sistēmās vai datu bāzēs.

Mūsu bibliotēka nodrošina Python izstrādātājus ar visām nepieciešamajām funkcijām dokumentiem un dokumentu lapu izvilkšanai atbilstoši norādītajam režīmam. Šis ir atsevišķs Python via .NET risinājums, kuram nav jāinstalē Microsoft Word, Acrobat Reader vai citas lietojumprogrammas.

Sadaliet dokumentu daļās, izmantojot Python

Sadaliet dokumenta saturu, izmantojot dažādus kritērijus Python kodā. Varat izmantot šādus lapu izvilkšanas režīmus: 'sadalīt pēc virsrakstiem', 'sadalīt pa sadaļām', 'sadalīt lapu pēc lapas', 'sadalīt pēc lapu diapazoniem'.

Pēc dokumenta sadalīšanas rezultātu var eksportēt vajadzīgajā faila formātā, izmantojot metodi 'Document.Save'. Varat arī kontrolēt, kā dokumenta daļas tiek eksportētas HTML vai EPUB formātā, izmantojot rekvizītu 'DocumentPartSavingCallback', kas ļaus novirzīt izvades straumes.

Viegli sadaliet dokumentus, izmantojot mūsu risinājumu Python via .NET. Šis piemērs parāda, kā sadalīt dokumentu, izmantojot Python:

Koda piemērs Python, lai sadalītu dokumentu daļās
Augšupielādējiet failu, kuru vēlaties sadalīt
Palaist kodu
Sarakstā atlasiet mērķa formātu
pip install aspose-words
Kopēt
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Palaist kodu

Kā sadalīt Word, PDF, HTML un citus failu formātus pakalpojumā Python

  1. Instalējiet Python bibliotēku, lai sadalītu dokumentus programmatiski.
  2. Pievienojiet bibliotēkas atsauci (importējiet bibliotēku) savam Python projektam.
  3. Atveriet avota dokumentu pakalpojumā Python.
  4. Izsauciet extract_pages() metodi, lai no dokumenta izvilktu noteiktas lapas.
  5. Iegūstiet dokumentu sadalīšanas rezultātu kā atsevišķus failus.

Python bibliotēka, lai sadalītu failus

Mēs mitinām Python pakotnes PyPi krātuvēs. Lūdzu, izpildiet detalizētos norādījumus par to, kā izstrādātāja vidē 'Aspose.Words for Python via .NET'.

Sistēmas prasības

Šī pakotne ir saderīga ar Python ≥3.5 un <3.12. Ja izstrādājat programmatūru operētājsistēmai Linux, lūdzu, skatiet papildu prasības gcc un libpython sadaļā Produkta dokumentācija.

Populārākie failu formāti sadalīšanai

5%

Abonējiet Aspose produktu atjauninājumus

Saņemiet ikmēneša biļetenus un piedāvājumus, kas tiek piegādāti tieši jūsu pastkastē.

© Aspose Pty Ltd 2001-2024. Visas tiesības aizsargātas.