Gebruik Python via .NET bibliotheek om HTML bestanden in delen te splitsen. U kunt de geëxtraheerde HTML pagina's integreren met andere gegevens en als resultaat documenten krijgen van de vorm en inhoud die u nodig heeft. Door HTML in delen te splitsen, kunt u gemakkelijker samenwerken aan HTML bestanden.
Deze softwarebibliotheek biedt Python ontwikkelaars een reeks functies om bestanden HTML in delen te splitsen. Het splitsen van een HTML in afzonderlijke bestanden kan worden gebruikt om het gemakkelijker te maken om parallel met secties van een document te werken. Als bijvoorbeeld meerdere mensen tegelijkertijd aan één HTML werken, kunnen ze het werk versnellen door HTML te splitsen. Het splitsen van HTML kan deel uitmaken van een technologie voor het extraheren van tekst uit bestanden HTML en het integreren van gegevens in geautomatiseerde informatiesystemen of databases.
Onze bibliotheek biedt Python ontwikkelaars alle noodzakelijke functies om HTML in delen te splitsen en pagina's te extraheren volgens de opgegeven modus. Dit is een stand-alone Python via .NET oplossing waarvoor geen Microsoft Word, Acrobat Reader of andere applicaties geïnstalleerd hoeven te worden.
Split HTML inhoud met verschillende criteria in Python code. U kunt de volgende pagina-extractiemodi gebruiken voor HTML bestanden: 'split by headings', 'split by section', 'split page by page', 'split by page ranges'.
Nadat u uw bestand HTML in delen heeft opgesplitst, kunt u het resultaat met de 'Document.Save' methode exporteren naar het gewenste bestandsformaat. U kunt ook bepalen hoe de HTML onderdelen worden geëxporteerd naar HTML of EPUB met behulp van de eigenschap 'DocumentPartSavingCallback', waarmee u uitvoerstromen kunt omleiden.
Splits HTML documenten eenvoudig met onze oplossing voor Python via .NET. Het volgende voorbeeld laat zien hoe u een HTML met Python:
pip install aspose-words
Kopiëren
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
We hosten onze Python pakketten in PyPi- repositories. Volg de stapsgewijze instructies voor het installeren van "Aspose.Words for Python via .NET" in uw ontwikkelomgeving.
Dit pakket is compatibel met Python ≥3.5 en <3.12. Als u software voor Linux ontwikkelt, bekijk dan de aanvullende vereisten voor gcc en libpython in Productdocumentatie.