Splits DOCX in delen in Python

Snelle Python bibliotheek om één DOCX bestand te splitsen in een groep kleinere bestanden volgens de opgegeven criteria

Gebruik Python via .NET bibliotheek om DOCX bestanden in delen te splitsen. U kunt de geëxtraheerde DOCX pagina's integreren met andere gegevens en als resultaat documenten krijgen van de vorm en inhoud die u nodig heeft. Door DOCX in delen te splitsen, kunt u gemakkelijker samenwerken aan DOCX bestanden.

Codefragment bekijken

Splits DOCX in Python

Deze softwarebibliotheek biedt Python-ontwikkelaars een reeks functies om DOCX-bestanden in delen te splitsen. Het opsplitsen van een DOCX-document in afzonderlijke bestanden kan worden gebruikt om het gemakkelijker te maken om parallel met secties van een document te werken. Als meerdere mensen bijvoorbeeld tegelijkertijd aan één DOCX-document werken, kan het splitsen ervan het werk versnellen. Het splitsen van DOCX-documenten kan deel uitmaken van een technologie voor het extraheren van tekst uit DOCX-bestanden en het integreren van gegevens in geautomatiseerde informatiesystemen of databases.

Onze bibliotheek biedt Python-ontwikkelaars alle noodzakelijke functies om DOCX-bestanden in delen te splitsen en pagina's te extraheren volgens de opgegeven modus. Dit is een stand-alone Python via .NET-oplossing waarvoor geen Microsoft Word, Acrobat Reader of andere applicaties geïnstalleerd hoeven te worden.

Splits het DOCX-document in delen met Python

Splits DOCX-inhoud met behulp van verschillende criteria in Python-code. U kunt de volgende pagina-extractiemodi gebruiken voor DOCX-documenten: 'opsplitsen op koptekst', 'opsplitsen op secties', 'pagina opsplitsen op pagina', 'opsplitsen op paginabereik'.

Nadat u uw DOCX-bestand in delen heeft gesplitst, kunt u het resultaat via de 'Document.Save'-methode naar het gewenste bestandsformaat exporteren. U kunt ook bepalen hoe de DOCX-documentdelen naar HTML of EPUB worden geëxporteerd met behulp van de eigenschap 'DocumentPartSavingCallback', waarmee u uitvoerstromen kunt omleiden.

Splits DOCX-documenten eenvoudig met onze oplossing voor Python via .NET. Het volgende voorbeeld laat zien hoe u een DOCX-document kunt splitsen met Python:

Python codevoorbeeld om een DOCX bestand te splitsen
Upload een bestand dat u wilt splitsen
Voer code uit
Selecteer het doelformaat uit de lijst
pip install aspose-words
Kopiëren
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Voer code uit

Hoe DOCX opsplitsen in Python

  1. Installeer Python bibliotheek om DOCX bestanden programmatisch te splitsen.
  2. Voeg een bibliotheekreferentie toe (importeer de bibliotheek) aan uw Python project.
  3. Open de DOCX in Python.
  4. Roep de methode extract_pages() aan om specifieke pagina's uit DOCX te extraheren.
  5. Krijg het resultaat van DOCX splitsen als afzonderlijke bestanden.

Python bibliotheek om DOCX documenten te splitsen

We hosten onze Python pakketten in PyPi- repositories. Volg de stapsgewijze instructies voor het installeren van "Aspose.Words for Python via .NET" in uw ontwikkelomgeving.

systeem vereisten

Dit pakket is compatibel met Python ≥3.5 en <3.12. Als u software voor Linux ontwikkelt, bekijk dan de aanvullende vereisten voor gcc en libpython in Productdocumentatie.

Andere ondersteunde DOCX splitsingsbewerkingen

U kunt DOCX ook splitsen in andere bestandsindelingen:

5%

Abonneer u op productupdates van Aspose

Ontvang maandelijkse nieuwsbrieven en aanbiedingen direct in je mailbox.

© Aspose Pty Ltd 2001-2024. Alle rechten voorbehouden.