Utilisez la Python via .NET bibliothèque pour diviser les HTML fichiers en parties. Vous pouvez intégrer les pages HTML extraites avec d'autres données et, par conséquent, obtenir des documents de la forme et du contenu dont vous avez besoin. Le fractionnement de HTML en parties facilite la collaboration sur les HTML fichiers.
Cette bibliothèque de logiciels fournit aux Python développeurs un ensemble de fonctions pour diviser les HTML fichiers en plusieurs parties. Le fractionnement d'un HTML en fichiers séparés peut être utilisé pour faciliter le travail avec des sections d'un document en parallèle. Par exemple, si plusieurs personnes travaillent sur un HTML en même temps, le fractionnement de HTML leur permettra d'accélérer le travail. Le fractionnement HTML peut faire partie d'une technologie d'extraction de texte à partir de HTML fichiers et d'intégration de données dans des systèmes d'information automatisés ou des bases de données.
Notre bibliothèque fournit aux Python développeurs toutes les fonctions nécessaires pour diviser HTML en parties et extraire les pages selon le mode spécifié. Il s'agit d'une Python via .NET solution qui ne nécessite pas l'installation de Microsoft Word, Acrobat Reader ou d'autres applications.
Divisez le contenu HTML en utilisant différents critères dans le Python code. Vous pouvez utiliser les modes d'extraction de page suivants pour les HTML fichiers: 'split by headers', 'split by sections', 'split page by page', 'split by page ranges'.
Après avoir divisé votre HTML fichier en plusieurs parties, vous pouvez exporter le résultat au format de fichier requis à l'aide de la méthode 'Document.Save'. Vous pouvez également contrôler la manière dont les parties HTML sont exportées vers HTML ou EPUB à l'aide de la propriété 'DocumentPartSavingCallback', qui vous permettra de rediriger les flux de sortie.
Divisez facilement les HTML documents avec notre solution pour Python via .NET. L'exemple suivant montre comment diviser un HTML à l'aide Python:
pip install aspose-words
Copie
import aspose.words as aw
doc = aw.Document("Input.html")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.html")
Nous hébergeons Python dans des référentiels PyPi. Veuillez suivre les instructions étape par étape sur la façon d'installer "Aspose.Words for Python via .NET" dans votre environnement de développeur.
Ce package est compatible avec Python ≥3.5 et <3.12. Si vous développez des logiciels pour Linux, veuillez consulter les exigences supplémentaires pour gcc et libpython dans Product Documentation.