Gebruik Python via .NET bibliotheek om DOCX bestanden in delen te splitsen. U kunt de geëxtraheerde DOCX pagina's integreren met andere gegevens en als resultaat documenten krijgen van de vorm en inhoud die u nodig heeft. Door DOCX in delen te splitsen, kunt u gemakkelijker samenwerken aan DOCX bestanden.
Deze softwarebibliotheek biedt Python-ontwikkelaars een reeks functies om DOCX-bestanden in delen te splitsen. Het opsplitsen van een DOCX-document in afzonderlijke bestanden kan worden gebruikt om het gemakkelijker te maken om parallel met secties van een document te werken. Als meerdere mensen bijvoorbeeld tegelijkertijd aan één DOCX-document werken, kan het splitsen ervan het werk versnellen. Het splitsen van DOCX-documenten kan deel uitmaken van een technologie voor het extraheren van tekst uit DOCX-bestanden en het integreren van gegevens in geautomatiseerde informatiesystemen of databases.
Onze bibliotheek biedt Python-ontwikkelaars alle noodzakelijke functies om DOCX-bestanden in delen te splitsen en pagina's te extraheren volgens de opgegeven modus. Dit is een stand-alone Python via .NET-oplossing waarvoor geen Microsoft Word, Acrobat Reader of andere applicaties geïnstalleerd hoeven te worden.
Splits DOCX-inhoud met behulp van verschillende criteria in Python-code. U kunt de volgende pagina-extractiemodi gebruiken voor DOCX-documenten: 'opsplitsen op koptekst', 'opsplitsen op secties', 'pagina opsplitsen op pagina', 'opsplitsen op paginabereik'.
Nadat u uw DOCX-bestand in delen heeft gesplitst, kunt u het resultaat via de 'Document.Save'-methode naar het gewenste bestandsformaat exporteren. U kunt ook bepalen hoe de DOCX-documentdelen naar HTML of EPUB worden geëxporteerd met behulp van de eigenschap 'DocumentPartSavingCallback', waarmee u uitvoerstromen kunt omleiden.
Splits DOCX-documenten eenvoudig met onze oplossing voor Python via .NET. Het volgende voorbeeld laat zien hoe u een DOCX-document kunt splitsen met Python:
pip install aspose-words
Kopiëren
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
We hosten onze Python pakketten in PyPi- repositories. Volg de stapsgewijze instructies voor het installeren van "Aspose.Words for Python via .NET" in uw ontwikkelomgeving.
Dit pakket is compatibel met Python ≥3.5 en <3.12. Als u software voor Linux ontwikkelt, bekijk dan de aanvullende vereisten voor gcc en libpython in Productdocumentatie.