Rozdeliť dokumenty na časti v Python

Rýchla knižnica Python na rozdelenie dokumentu do skupiny menších súborov podľa daných kritérií

Na rozdelenie dokumentov na časti použite knižnicu Python. Extrahované stránky môžete integrovať s inými údajmi a ako výsledok získať dokumenty vo forme a obsahu, ktoré požadujete. Rozdelenie dokumentov na časti uľahčuje spoluprácu na nich.

Zobraziť útržok kódu

Rozdeľte Word, PDF pomocou Python

Táto softvérová knižnica poskytuje vývojárom Python sadu funkcií na rozdelenie Word dokumentov, PDF, EPUB, HTML, DOCX na časti. Rozdelenie textu do samostatných súborov možno použiť na uľahčenie práce s časťami dokumentov. Procedúra rozdeľovania dokumentov môže byť súčasťou technológie integrácie dát do automatizovaných informačných systémov alebo databáz.

Naša knižnica poskytuje vývojárom Python všetky potrebné funkcie pre dokumenty a extrahovanie stránok dokumentov podľa zadaného režimu. Toto je samostatné riešenie Python via .NET, ktoré nevyžaduje nainštalované aplikácie Microsoft Word, Acrobat Reader ani iné aplikácie.

Rozdeľte dokument na časti pomocou Python

Rozdeľte obsah dokumentu pomocou rôznych kritérií v kóde Python. Môžete použiť nasledujúce režimy extrakcie stránky: "rozdelenie podľa nadpisov", "rozdelenie podľa sekcií", "rozdelenie strany po stránke", "rozdelenie podľa rozsahov strán".

Po rozdelení dokumentu môžete výsledok exportovať do požadovaného formátu súboru pomocou metódy 'Document.Save'. Môžete tiež ovládať, ako sa časti dokumentu exportujú do HTML formátov alebo EPUB, pomocou vlastnosti 'DocumentPartSavingCallback', ktorá vám umožní presmerovať výstupné toky.

Rozdeľte dokumenty jednoducho pomocou nášho riešenia pre Python via .NET. Nasledujúci príklad ukazuje, ako rozdeliť dokument pomocou Python:

Príklad kódu v Python na rozdelenie dokumentov na časti
Nahrajte súbor, ktorý chcete rozdeliť
Spustiť kód
Vyberte cieľový formát zo zoznamu
pip install aspose-words
Kopírovať
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Spustiť kód

Ako rozdeliť Word, PDF, HTML a ďalšie formáty súborov v Python

  1. Nainštalujte knižnicu Python na programové rozdelenie dokumentov.
  2. Pridajte odkaz na knižnicu (importujte knižnicu) do svojho Python projektu.
  3. Otvorte zdrojový dokument v Python.
  4. Zavolaním metódy extract_pages() extrahujte konkrétne strany z dokumentu.
  5. Získajte výsledok rozdelenia dokumentu ako samostatné súbory.

Knižnica Python na rozdelenie súborov

Naše balíčky Python hostíme v úložiskách PyPi. Postupujte podľa podrobných pokynov, ako nainštalovať "Aspose.Words for Python via .NET" do vášho vývojárskeho prostredia.

Požiadavky na systém

Tento balík je kompatibilný s Python ≥3.5 a <3.12. Ak vyvíjate softvér pre Linux, pozrite si ďalšie požiadavky pre gcc a libpython v dokumentácii k produktu.

Najpopulárnejšie formáty súborov na rozdelenie

5%

Prihláste sa na odber aktualizácií produktov Aspose

Získajte mesačné bulletiny a ponuky priamo do vašej poštovej schránky.

© Aspose Pty Ltd 2001-2024. Všetky práva vyhradené.