Splits DOC in delen in Python

Snelle Python bibliotheek om één DOC bestand te splitsen in een groep kleinere bestanden volgens de opgegeven criteria

Gebruik Python via .NET bibliotheek om DOC bestanden in delen te splitsen. U kunt de geëxtraheerde DOC pagina's integreren met andere gegevens en als resultaat documenten krijgen van de vorm en inhoud die u nodig heeft. Door DOC in delen te splitsen, kunt u gemakkelijker samenwerken aan DOC bestanden.

Codefragment bekijken

Splits DOC in Python

Deze softwarebibliotheek biedt Python-ontwikkelaars een reeks functies om DOC-bestanden in delen te splitsen. Het opsplitsen van een DOC-document in afzonderlijke bestanden kan worden gebruikt om het gemakkelijker te maken om parallel met secties van een document te werken. Als meerdere mensen bijvoorbeeld tegelijkertijd aan één DOC-document werken, kan het splitsen ervan het werk versnellen. Het splitsen van DOC-documenten kan deel uitmaken van een technologie voor het extraheren van tekst uit DOC-bestanden en het integreren van gegevens in geautomatiseerde informatiesystemen of databases.

Onze bibliotheek biedt Python-ontwikkelaars alle noodzakelijke functies om DOC-bestanden in delen te splitsen en pagina's te extraheren volgens de opgegeven modus. Dit is een stand-alone Python via .NET-oplossing waarvoor geen Microsoft Word, Acrobat Reader of andere applicaties geïnstalleerd hoeven te worden.

Splits het DOC-document in delen met Python

Splits DOC-inhoud met behulp van verschillende criteria in Python-code. U kunt de volgende pagina-extractiemodi gebruiken voor DOC-documenten: 'opsplitsen op koptekst', 'opsplitsen op secties', 'pagina opsplitsen op pagina', 'opsplitsen op paginabereik'.

Nadat u uw DOC-bestand in delen heeft gesplitst, kunt u het resultaat via de 'Document.Save'-methode naar het gewenste bestandsformaat exporteren. U kunt ook bepalen hoe de DOC-documentdelen naar HTML of EPUB worden geëxporteerd met behulp van de eigenschap 'DocumentPartSavingCallback', waarmee u uitvoerstromen kunt omleiden.

Splits DOC-documenten eenvoudig met onze oplossing voor Python via .NET. Het volgende voorbeeld laat zien hoe u een DOC-document kunt splitsen met Python:

Python codevoorbeeld om een DOC bestand te splitsen
Upload een bestand dat u wilt splitsen
Voer code uit
Selecteer het doelformaat uit de lijst
pip install aspose-words
Kopiëren
import aspose.words as aw

doc = aw.Document("Input.doc")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.doc")
Voer code uit

Hoe DOC opsplitsen in Python

  1. Installeer Python bibliotheek om DOC bestanden programmatisch te splitsen.
  2. Voeg een bibliotheekreferentie toe (importeer de bibliotheek) aan uw Python project.
  3. Open de DOC in Python.
  4. Roep de methode extract_pages() aan om specifieke pagina's uit DOC te extraheren.
  5. Krijg het resultaat van DOC splitsen als afzonderlijke bestanden.

Python bibliotheek om DOC documenten te splitsen

We hosten onze Python pakketten in PyPi- repositories. Volg de stapsgewijze instructies voor het installeren van "Aspose.Words for Python via .NET" in uw ontwikkelomgeving.

systeem vereisten

Dit pakket is compatibel met Python ≥3.5 en <3.12. Als u software voor Linux ontwikkelt, bekijk dan de aanvullende vereisten voor gcc en libpython in Productdocumentatie.

Andere ondersteunde DOC splitsingsbewerkingen

U kunt DOC ook splitsen in andere bestandsindelingen:

5%

Abonneer u op productupdates van Aspose

Ontvang maandelijkse nieuwsbrieven en aanbiedingen direct in je mailbox.

© Aspose Pty Ltd 2001-2024. Alle rechten voorbehouden.