Splits HTML in delen in Python

Snelle Python bibliotheek om één HTML bestand te splitsen in een groep kleinere bestanden volgens de opgegeven criteria

Gebruik Python via .NET bibliotheek om HTML bestanden in delen te splitsen. U kunt de geëxtraheerde HTML pagina's integreren met andere gegevens en als resultaat documenten krijgen van de vorm en inhoud die u nodig heeft. Door HTML in delen te splitsen, kunt u gemakkelijker samenwerken aan HTML bestanden.

Codefragment bekijken

Splits HTML met Python

Deze softwarebibliotheek biedt Python ontwikkelaars een reeks functies om bestanden HTML in delen te splitsen. Het splitsen van een HTML in afzonderlijke bestanden kan worden gebruikt om het gemakkelijker te maken om parallel met secties van een document te werken. Als bijvoorbeeld meerdere mensen tegelijkertijd aan één HTML werken, kunnen ze het werk versnellen door HTML te splitsen. Het splitsen van HTML kan deel uitmaken van een technologie voor het extraheren van tekst uit bestanden HTML en het integreren van gegevens in geautomatiseerde informatiesystemen of databases.

Onze bibliotheek biedt Python ontwikkelaars alle noodzakelijke functies om HTML in delen te splitsen en pagina's te extraheren volgens de opgegeven modus. Dit is een stand-alone Python via .NET oplossing waarvoor geen Microsoft Word, Acrobat Reader of andere applicaties geïnstalleerd hoeven te worden.

Splits een bestand HTML in delen in Python code

Split HTML inhoud met verschillende criteria in Python code. U kunt de volgende pagina-extractiemodi gebruiken voor HTML bestanden: 'split by headings', 'split by section', 'split page by page', 'split by page ranges'.

Nadat u uw bestand HTML in delen heeft opgesplitst, kunt u het resultaat met de 'Document.Save' methode exporteren naar het gewenste bestandsformaat. U kunt ook bepalen hoe de HTML onderdelen worden geëxporteerd naar HTML of EPUB met behulp van de eigenschap 'DocumentPartSavingCallback', waarmee u uitvoerstromen kunt omleiden.

Splits HTML documenten eenvoudig met onze oplossing voor Python via .NET. Het volgende voorbeeld laat zien hoe u een HTML met Python:

Python codevoorbeeld om een HTML bestand te splitsen
Upload een bestand dat u wilt splitsen
Voer code uit
Selecteer het doelformaat uit de lijst
pip install aspose-words
Kopiëren
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Voer code uit

Hoe HTML opsplitsen in Python

  1. Installeer Python bibliotheek om HTML bestanden programmatisch te splitsen.
  2. Voeg een bibliotheekreferentie toe (importeer de bibliotheek) aan uw Python project.
  3. Open de HTML in Python.
  4. Roep de methode extract_pages() aan om specifieke pagina's uit HTML te extraheren.
  5. Krijg het resultaat van HTML splitsen als afzonderlijke bestanden.

Python bibliotheek om HTML documenten te splitsen

We hosten onze Python pakketten in PyPi- repositories. Volg de stapsgewijze instructies voor het installeren van "Aspose.Words for Python via .NET" in uw ontwikkelomgeving.

systeem vereisten

Dit pakket is compatibel met Python ≥3.5 en <3.12. Als u software voor Linux ontwikkelt, bekijk dan de aanvullende vereisten voor gcc en libpython in Productdocumentatie.

Andere ondersteunde HTML splitsingsbewerkingen

U kunt HTML ook splitsen in andere bestandsindelingen:

5%

Abonneer u op productupdates van Aspose

Ontvang maandelijkse nieuwsbrieven en aanbiedingen direct in je mailbox.

© Aspose Pty Ltd 2001-2024. Alle rechten voorbehouden.