Na rozdelenie dokumentov na časti použite knižnicu Python. Extrahované stránky môžete integrovať s inými údajmi a ako výsledok získať dokumenty vo forme a obsahu, ktoré požadujete. Rozdelenie dokumentov na časti uľahčuje spoluprácu na nich.
Táto softvérová knižnica poskytuje vývojárom Python sadu funkcií na rozdelenie Word dokumentov, PDF, EPUB, HTML, DOCX na časti. Rozdelenie textu do samostatných súborov možno použiť na uľahčenie práce s časťami dokumentov. Procedúra rozdeľovania dokumentov môže byť súčasťou technológie integrácie dát do automatizovaných informačných systémov alebo databáz.
Naša knižnica poskytuje vývojárom Python všetky potrebné funkcie pre dokumenty a extrahovanie stránok dokumentov podľa zadaného režimu. Toto je samostatné riešenie Python via .NET, ktoré nevyžaduje nainštalované aplikácie Microsoft Word, Acrobat Reader ani iné aplikácie.
Rozdeľte obsah dokumentu pomocou rôznych kritérií v kóde Python. Môžete použiť nasledujúce režimy extrakcie stránky: "rozdelenie podľa nadpisov", "rozdelenie podľa sekcií", "rozdelenie strany po stránke", "rozdelenie podľa rozsahov strán".
Po rozdelení dokumentu môžete výsledok exportovať do požadovaného formátu súboru pomocou metódy 'Document.Save'. Môžete tiež ovládať, ako sa časti dokumentu exportujú do HTML formátov alebo EPUB, pomocou vlastnosti 'DocumentPartSavingCallback', ktorá vám umožní presmerovať výstupné toky.
Rozdeľte dokumenty jednoducho pomocou nášho riešenia pre Python via .NET. Nasledujúci príklad ukazuje, ako rozdeliť dokument pomocou Python:
pip install aspose-words
Kopírovať
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
Naše balíčky Python hostíme v úložiskách PyPi. Postupujte podľa podrobných pokynov, ako nainštalovať "Aspose.Words for Python via .NET" do vášho vývojárskeho prostredia.
Tento balík je kompatibilný s Python ≥3.5 a <3.12. Ak vyvíjate softvér pre Linux, pozrite si ďalšie požiadavky pre gcc a libpython v dokumentácii k produktu.