K rozdělení dokumentů na části použijte knihovnu Python. Extrahované stránky můžete integrovat s dalšími daty a v důsledku toho získat dokumenty ve formě a obsahu, které požadujete. Rozdělení dokumentů na části usnadňuje spolupráci na nich.
Tato softwarová knihovna poskytuje vývojářům Python sadu funkcí pro rozdělení Word dokumentů, PDF, EPUB, HTML, DOCX na části. Pro snazší práci s částmi dokumentů lze použít rozdělení textu do samostatných souborů. Procedura dělení dokumentů může být součástí technologie pro integraci dat do automatizovaných informačních systémů nebo databází.
Naše knihovna poskytuje vývojářům Python všechny potřebné funkce pro dokumenty a extrahování stránek dokumentů podle zadaného režimu. Toto je samostatné řešení Python via .NET, které nevyžaduje instalaci aplikací Microsoft Word, Acrobat Reader nebo jiné aplikace.
Rozdělte obsah dokumentu pomocí různých kritérií v Python kódu. Můžete použít následující režimy extrakce stránky: "rozdělit podle nadpisů", "rozdělit podle sekcí", "rozdělit stránku po stránce", "rozdělit podle rozsahů stránek".
Po rozdělení dokumentu můžete výsledek exportovat do požadovaného formátu souboru pomocí metody 'Document.Save'. Můžete také ovládat, jak se části dokumentu exportují do HTML formátů nebo EPUB, pomocí vlastnosti 'DocumentPartSavingCallback', která vám umožní přesměrovat výstupní proudy.
Rozdělte dokumenty snadno pomocí našeho řešení pro Python via .NET. Následující příklad ukazuje, jak rozdělit dokument pomocí Python:
pip install aspose-words
Kopírovat
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
Naše balíčky Python hostujeme v úložištích PyPi. Postupujte prosím podle pokynů krok za krokem, jak nainstalovat "Aspose.Words for Python via .NET" do vašeho vývojářského prostředí.
Tento balíček je kompatibilní s Python ≥3.5 a <3.12. Pokud vyvíjíte software pro Linux, podívejte se prosím na další požadavky pro gcc a libpython v dokumentaci k produktu.