Rozdělit dokumenty na části v Python

Rychlá knihovna Python pro rozdělení dokumentu do skupiny menších souborů podle daných kritérií

K rozdělení dokumentů na části použijte knihovnu Python. Extrahované stránky můžete integrovat s dalšími daty a v důsledku toho získat dokumenty ve formě a obsahu, které požadujete. Rozdělení dokumentů na části usnadňuje spolupráci na nich.

Zobrazit fragment kódu

Rozdělte Word, PDF pomocí Python

Tato softwarová knihovna poskytuje vývojářům Python sadu funkcí pro rozdělení Word dokumentů, PDF, EPUB, HTML, DOCX na části. Pro snazší práci s částmi dokumentů lze použít rozdělení textu do samostatných souborů. Procedura dělení dokumentů může být součástí technologie pro integraci dat do automatizovaných informačních systémů nebo databází.

Naše knihovna poskytuje vývojářům Python všechny potřebné funkce pro dokumenty a extrahování stránek dokumentů podle zadaného režimu. Toto je samostatné řešení Python via .NET, které nevyžaduje instalaci aplikací Microsoft Word, Acrobat Reader nebo jiné aplikace.

Rozdělte dokument na části pomocí Python

Rozdělte obsah dokumentu pomocí různých kritérií v Python kódu. Můžete použít následující režimy extrakce stránky: "rozdělit podle nadpisů", "rozdělit podle sekcí", "rozdělit stránku po stránce", "rozdělit podle rozsahů stránek".

Po rozdělení dokumentu můžete výsledek exportovat do požadovaného formátu souboru pomocí metody 'Document.Save'. Můžete také ovládat, jak se části dokumentu exportují do HTML formátů nebo EPUB, pomocí vlastnosti 'DocumentPartSavingCallback', která vám umožní přesměrovat výstupní proudy.

Rozdělte dokumenty snadno pomocí našeho řešení pro Python via .NET. Následující příklad ukazuje, jak rozdělit dokument pomocí Python:

Příklad kódu v Python pro rozdělení dokumentů na části
Nahrajte soubor, který chcete rozdělit
Spustit kód
Vyberte cílový formát ze seznamu
pip install aspose-words
Kopírovat
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Spustit kód

Jak rozdělit Word, PDF, HTML a další formáty souborů v Python

  1. Chcete-li programově rozdělit dokumenty, nainstalujte si knihovnu Python.
  2. Přidejte odkaz na knihovnu (importujte knihovnu) do svého Python projektu.
  3. Otevřete zdrojový dokument v Python.
  4. Chcete-li z dokumentu extrahovat konkrétní stránky, zavolejte metodu extract_pages().
  5. Získejte výsledek rozdělení dokumentu jako samostatné soubory.

Knihovna Python k rozdělení souborů

Naše balíčky Python hostujeme v úložištích PyPi. Postupujte prosím podle pokynů krok za krokem, jak nainstalovat "Aspose.Words for Python via .NET" do vašeho vývojářského prostředí.

Požadavky na systém

Tento balíček je kompatibilní s Python ≥3.5 a <3.12. Pokud vyvíjíte software pro Linux, podívejte se prosím na další požadavky pro gcc a libpython v dokumentaci k produktu.

Nejoblíbenější formáty souborů pro rozdělení

5%

Přihlaste se k odběru aktualizací produktu Aspose

Získejte měsíční zpravodaje a nabídky přímo do vaší poštovní schránky.

© Aspose Pty Ltd 2001-2024. Všechna práva vyhrazena.