Χωρίστε το HTML σε μέρη στο Python

Γρήγορη βιβλιοθήκη Python για να χωρίσετε ένα HTML αρχείο σε μια ομάδα μικρότερων αρχείων σύμφωνα με τα δεδομένα κριτήρια

Χρησιμοποιήστε τη βιβλιοθήκη Python via .NET για να χωρίσετε HTML αρχεία σε μέρη. Μπορείτε να ενσωματώσετε τις εξαγόμενες σελίδες HTML με άλλα δεδομένα και, ως αποτέλεσμα, να λάβετε έγγραφα της μορφής και του περιεχομένου που χρειάζεστε. Ο διαχωρισμός του HTML σε μέρη διευκολύνει τη συνεργασία σε HTML αρχεία.

Προβολή αποσπάσματος κώδικα

Διαχωρίστε το HTML χρησιμοποιώντας Python

Αυτή η βιβλιοθήκη λογισμικού παρέχει στους προγραμματιστές Python ένα σύνολο λειτουργιών για να χωρίσουν τα HTML αρχεία σε μέρη. Ο διαχωρισμός ενός HTML σε ξεχωριστά αρχεία μπορεί να χρησιμοποιηθεί για να διευκολύνει την παράλληλη εργασία με τμήματα ενός εγγράφου. Για παράδειγμα, εάν πολλά άτομα εργάζονται σε ένα HTML ταυτόχρονα, τότε ο διαχωρισμός HTML θα τους επιτρέψει να επιταχύνουν την εργασία. Ο διαχωρισμός HTML μπορεί να είναι μέρος μιας τεχνολογίας εξαγωγής κειμένου από HTML αρχεία και ενσωμάτωσης δεδομένων σε αυτοματοποιημένα συστήματα πληροφοριών ή βάσεις δεδομένων.

Η βιβλιοθήκη μας παρέχει στους προγραμματιστές Python όλες τις απαραίτητες λειτουργίες για να χωρίσουν το HTML σε μέρη και να εξαγάγουν σελίδες σύμφωνα με την καθορισμένη λειτουργία. Αυτή είναι μια αυτόνομη λύση Python via .NET που δεν χρειάζεται εγκατεστημένο το Microsoft Word, το Acrobat Reader ή άλλες εφαρμογές.

Διαχωρίστε ένα HTML αρχείο σε μέρη στον κώδικα Python

Διαχωρίστε το περιεχόμενο HTML χρησιμοποιώντας διαφορετικά κριτήρια στον κώδικα Python. Μπορείτε να χρησιμοποιήσετε τις ακόλουθες λειτουργίες εξαγωγής σελίδων για HTML αρχεία: 'διαίρεση κατά επικεφαλίδες', 'διαίρεση κατά τμήματα', 'διαχωρισμός σελίδας προς σελίδα', 'διαχωρισμός κατά εύρος σελίδων'.

Αφού χωρίσετε το αρχείο σας HTML σε μέρη, μπορείτε να εξαγάγετε το αποτέλεσμα στην απαιτούμενη μορφή αρχείου χρησιμοποιώντας τη μέθοδο 'Document.Save'. Μπορείτε επίσης να ελέγξετε τον τρόπο εξαγωγής των τμημάτων HTML σε HTML ή EPUB χρησιμοποιώντας την ιδιότητα 'DocumentPartSavingCallback', η οποία θα σας επιτρέψει να ανακατευθύνετε τις ροές εξόδου.

Διαχωρίστε εύκολα HTML έγγραφα με τη λύση μας για το Python via .NET. Το παρακάτω παράδειγμα δείχνει πώς να χωρίσετε ένα HTML χρησιμοποιώντας Python:

Παράδειγμα κώδικα Python για να χωρίσετε ένα HTML αρχείο
Ανεβάστε ένα αρχείο που θέλετε να χωρίσετε
Εκτέλεση κώδικα
Επιλέξτε τη μορφή προορισμού από τη λίστα
pip install aspose-words
αντίγραφο
import aspose.words as aw

doc = aw.Document("Input.html")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.html")
Εκτέλεση κώδικα

Πώς να χωρίσετε το HTML σε Python

  1. Εγκαταστήστε τη βιβλιοθήκη Python για να χωρίσετε HTML αρχεία μέσω προγραμματισμού.
  2. Προσθέστε μια αναφορά βιβλιοθήκης (εισαγωγή της βιβλιοθήκης) στο έργο σας Python.
  3. Ανοίξτε το HTML στο Python.
  4. Καλέστε τη μέθοδο extract_pages() για να εξαγάγετε συγκεκριμένες σελίδες από το HTML.
  5. Λάβετε το αποτέλεσμα του διαχωρισμού του HTML ως ξεχωριστά αρχεία.

Python βιβλιοθήκη για διαχωρισμό HTML εγγράφων

Φιλοξενούμε τα πακέτα Python μας στα αποθετήρια PyPi. Ακολουθήστε τις οδηγίες βήμα προς βήμα σχετικά με τον τρόπο εγκατάστασης του "Aspose.Words for Python via .NET" στο περιβάλλον προγραμματιστή σας.

Απαιτήσεις συστήματος

Αυτό το πακέτο είναι συμβατό με Python ≥3.5 και <3.12. Εάν αναπτύσσετε λογισμικό για Linux, ρίξτε μια ματιά στις πρόσθετες απαιτήσεις για gcc και libpython στην Τεκμηρίωση προϊόντος.

Άλλες υποστηριζόμενες λειτουργίες διαχωρισμού HTML

Μπορείτε επίσης να χωρίσετε το HTML σε άλλες μορφές αρχείων:

5%

Εγγραφείτε στις ενημερώσεις προϊόντων Aspose

Λάβετε μηνιαία ενημερωτικά δελτία και προσφορές απευθείας στο γραμματοκιβώτιό σας.

© Aspose Pty Ltd 2001-2024. Ολα τα δικαιώματα διατηρούνται.