Splits documenten in delen in Python

Snelle Python bibliotheek om een document op te splitsen in een groep kleinere bestanden volgens de opgegeven criteria

Gebruik de Python bibliotheek om documenten in delen te splitsen. U kunt de geëxtraheerde pagina's integreren met andere gegevens en als resultaat documenten krijgen van de vorm en inhoud die u nodig heeft. Door documenten in delen op te splitsen, wordt het eenvoudiger om eraan samen te werken.

Codefragment bekijken

Splits Word, PDF met Python

Deze softwarebibliotheek biedt Python ontwikkelaars een reeks functies om Word, PDF, EPUB, HTML en DOCX documenten in delen te splitsen. Het splitsen van tekst in afzonderlijke bestanden kan worden gebruikt om het werken met secties van documenten te vergemakkelijken. De procedure van documentsplitsing kan deel uitmaken van de technologie voor het integreren van gegevens in geautomatiseerde informatiesystemen of databases.

Onze bibliotheek biedt Python ontwikkelaars alle benodigde functies voor documenten en het extraheren van documentpagina's volgens de gespecificeerde modus. Dit is een stand-alone Python via .NET oplossing waarvoor geen Microsoft Word, Acrobat Reader of andere applicaties geïnstalleerd hoeven te worden.

Splits een document in delen met Python

Splits documentinhoud met behulp van verschillende criteria in Python code. U kunt de volgende pagina-extractiemodi gebruiken: 'gesplitst op kop', 'opgesplitst in secties', 'pagina gesplitst op pagina', 'gesplitst op paginabereik'.

Na het splitsen van het document kunt u het resultaat met de 'Document.Save' methode exporteren naar het gewenste bestandsformaat. U kunt ook bepalen hoe documentonderdelen worden geëxporteerd naar HTML of EPUB indelingen met behulp van de eigenschap 'DocumentPartSavingCallback', waarmee u uitvoerstromen kunt omleiden.

Splits documenten eenvoudig met onze oplossing voor Python via .NET. Het volgende voorbeeld laat zien hoe u een document splitst met Python:

Codevoorbeeld in Python om een document in delen te splitsen
Upload een bestand dat u wilt splitsen
Voer code uit
Selecteer het doelformaat uit de lijst
pip install aspose-words
Kopiëren
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Voer code uit

Hoe Word, PDF, HTML en andere bestandsindelingen te splitsen in Python

  1. Installeer de Python bibliotheek om documenten programmatisch te splitsen.
  2. Voeg een bibliotheekreferentie toe (importeer de bibliotheek) aan uw Python project.
  3. Open het brondocument in Python.
  4. Roep de methode extract_pages() aan om specifieke pagina's uit uw document te extraheren.
  5. Verkrijg het resultaat van het splitsen van documenten als afzonderlijke bestanden.

Python bibliotheek om bestanden te splitsen

We hosten onze Python pakketten in PyPi- repositories. Volg de stapsgewijze instructies voor het installeren van "Aspose.Words for Python via .NET" in uw ontwikkelomgeving.

systeem vereisten

Dit pakket is compatibel met Python ≥3.5 en <3.12. Als u software voor Linux ontwikkelt, bekijk dan de aanvullende vereisten voor gcc en libpython in Productdocumentatie.

Meest populaire bestandsindelingen om te splitsen

5%

Abonneer u op productupdates van Aspose

Ontvang maandelijkse nieuwsbrieven en aanbiedingen direct in je mailbox.

© Aspose Pty Ltd 2001-2024. Alle rechten voorbehouden.