Gebruik Python via .NET bibliotheek om DOC bestanden in delen te splitsen. U kunt de geëxtraheerde DOC pagina's integreren met andere gegevens en als resultaat documenten krijgen van de vorm en inhoud die u nodig heeft. Door DOC in delen te splitsen, kunt u gemakkelijker samenwerken aan DOC bestanden.
Deze softwarebibliotheek biedt Python-ontwikkelaars een reeks functies om DOC-bestanden in delen te splitsen. Het opsplitsen van een DOC-document in afzonderlijke bestanden kan worden gebruikt om het gemakkelijker te maken om parallel met secties van een document te werken. Als meerdere mensen bijvoorbeeld tegelijkertijd aan één DOC-document werken, kan het splitsen ervan het werk versnellen. Het splitsen van DOC-documenten kan deel uitmaken van een technologie voor het extraheren van tekst uit DOC-bestanden en het integreren van gegevens in geautomatiseerde informatiesystemen of databases.
Onze bibliotheek biedt Python-ontwikkelaars alle noodzakelijke functies om DOC-bestanden in delen te splitsen en pagina's te extraheren volgens de opgegeven modus. Dit is een stand-alone Python via .NET-oplossing waarvoor geen Microsoft Word, Acrobat Reader of andere applicaties geïnstalleerd hoeven te worden.
Splits DOC-inhoud met behulp van verschillende criteria in Python-code. U kunt de volgende pagina-extractiemodi gebruiken voor DOC-documenten: 'opsplitsen op koptekst', 'opsplitsen op secties', 'pagina opsplitsen op pagina', 'opsplitsen op paginabereik'.
Nadat u uw DOC-bestand in delen heeft gesplitst, kunt u het resultaat via de 'Document.Save'-methode naar het gewenste bestandsformaat exporteren. U kunt ook bepalen hoe de DOC-documentdelen naar HTML of EPUB worden geëxporteerd met behulp van de eigenschap 'DocumentPartSavingCallback', waarmee u uitvoerstromen kunt omleiden.
Splits DOC-documenten eenvoudig met onze oplossing voor Python via .NET. Het volgende voorbeeld laat zien hoe u een DOC-document kunt splitsen met Python:
pip install aspose-words
Kopiëren
import aspose.words as aw
doc = aw.Document("Input.doc")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.doc")
We hosten onze Python pakketten in PyPi- repositories. Volg de stapsgewijze instructies voor het installeren van "Aspose.Words for Python via .NET" in uw ontwikkelomgeving.
Dit pakket is compatibel met Python ≥3.5 en <3.12. Als u software voor Linux ontwikkelt, bekijk dan de aanvullende vereisten voor gcc en libpython in Productdocumentatie.