Diviser HTML en parties dans Python

Bibliothèque Python rapide pour diviser un HTML fichier en un groupe de fichiers plus petits selon les critères donnés

Utilisez la Python via .NET bibliothèque pour diviser les HTML fichiers en parties. Vous pouvez intégrer les pages HTML extraites avec d'autres données et, par conséquent, obtenir des documents de la forme et du contenu dont vous avez besoin. Le fractionnement de HTML en parties facilite la collaboration sur les HTML fichiers.

Afficher l'extrait de code

Diviser HTML en utilisant Python

Cette bibliothèque de logiciels fournit aux Python développeurs un ensemble de fonctions pour diviser les HTML fichiers en plusieurs parties. Le fractionnement d'un HTML en fichiers séparés peut être utilisé pour faciliter le travail avec des sections d'un document en parallèle. Par exemple, si plusieurs personnes travaillent sur un HTML en même temps, le fractionnement de HTML leur permettra d'accélérer le travail. Le fractionnement HTML peut faire partie d'une technologie d'extraction de texte à partir de HTML fichiers et d'intégration de données dans des systèmes d'information automatisés ou des bases de données.

Notre bibliothèque fournit aux Python développeurs toutes les fonctions nécessaires pour diviser HTML en parties et extraire les pages selon le mode spécifié. Il s'agit d'une Python via .NET solution qui ne nécessite pas l'installation de Microsoft Word, Acrobat Reader ou d'autres applications.

Diviser un HTML fichier en parties dans le Python code

Divisez le contenu HTML en utilisant différents critères dans le Python code. Vous pouvez utiliser les modes d'extraction de page suivants pour les HTML fichiers: 'split by headers', 'split by sections', 'split page by page', 'split by page ranges'.

Après avoir divisé votre HTML fichier en plusieurs parties, vous pouvez exporter le résultat au format de fichier requis à l'aide de la méthode 'Document.Save'. Vous pouvez également contrôler la manière dont les parties HTML sont exportées vers HTML ou EPUB à l'aide de la propriété 'DocumentPartSavingCallback', qui vous permettra de rediriger les flux de sortie.

Divisez facilement les HTML documents avec notre solution pour Python via .NET. L'exemple suivant montre comment diviser un HTML à l'aide Python:

Exemple de Python code pour diviser un HTML fichier
Téléchargez un fichier que vous souhaitez diviser
Exécuter le code
Sélectionnez le format cible dans la liste
pip install aspose-words
Copie
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Exécuter le code

Comment diviser HTML en plusieurs parties Python

  1. Installez la Python bibliothèque pour diviser les HTML fichiers par programme.
  2. Ajoutez une référence de bibliothèque (importez la bibliothèque) à votre projet Python.
  3. Ouvrez le HTML dans Python.
  4. Appelez la méthode extract_pages() pour extraire des pages spécifiques de HTML.
  5. Obtenez le résultat du fractionnement de HTML dans des fichiers séparés.

Python bibliothèque pour diviser HTML documents

Nous hébergeons Python dans des référentiels PyPi. Veuillez suivre les instructions étape par étape sur la façon d'installer "Aspose.Words for Python via .NET" dans votre environnement de développeur.

Configuration requise

Ce package est compatible avec Python ≥3.5 et <3.12. Si vous développez des logiciels pour Linux, veuillez consulter les exigences supplémentaires pour gcc et libpython dans Product Documentation.

Autres opérations de fractionnement HTML prises en charge

Vous pouvez également diviser HTML en d'autres formats de fichier :

5%

Abonnez-vous aux mises à jour des produits Aspose

Recevez des newsletters mensuelles et des offres directement dans votre boîte mail.

© Aspose Pty Ltd 2001-2024. Tous les droits sont réservés.