Διαχωρισμός εγγράφων σε μέρη σε Python

Γρήγορη βιβλιοθήκη Python για να χωρίσετε ένα έγγραφο σε μια ομάδα μικρότερων αρχείων σύμφωνα με τα δεδομένα κριτήρια

Χρησιμοποιήστε τη βιβλιοθήκη Python για να χωρίσετε έγγραφα σε μέρη. Μπορείτε να ενσωματώσετε τις εξαγόμενες σελίδες με άλλα δεδομένα και, ως αποτέλεσμα, να λάβετε έγγραφα της μορφής και του περιεχομένου που χρειάζεστε. Ο διαχωρισμός των εγγράφων σε μέρη διευκολύνει τη συνεργασία σε αυτά.

Προβολή αποσπάσματος κώδικα

Διαχωρίστε το Word, PDF χρησιμοποιώντας Python

Αυτή η βιβλιοθήκη λογισμικού παρέχει στους προγραμματιστές Python ένα σύνολο λειτουργιών για να χωρίσουν Word έγγραφα, PDF, EPUB, HTML, DOCX σε μέρη. Ο διαχωρισμός κειμένου σε ξεχωριστά αρχεία μπορεί να χρησιμοποιηθεί για να διευκολύνει την εργασία με τμήματα εγγράφων. Η διαδικασία διαχωρισμού εγγράφων μπορεί να είναι μέρος της τεχνολογίας για την ενσωμάτωση δεδομένων σε αυτοματοποιημένα συστήματα πληροφοριών ή βάσεις δεδομένων.

Η βιβλιοθήκη μας παρέχει στους προγραμματιστές Python όλες τις απαραίτητες λειτουργίες για έγγραφα και εξαγωγή σελίδων εγγράφων σύμφωνα με την καθορισμένη λειτουργία. Αυτή είναι μια αυτόνομη λύση Python via .NET που δεν χρειάζεται εγκατεστημένο το Microsoft Word, το Acrobat Reader ή άλλες εφαρμογές.

Διαχωρίστε ένα έγγραφο σε μέρη χρησιμοποιώντας Python

Διαχωρίστε το περιεχόμενο του εγγράφου χρησιμοποιώντας διαφορετικά κριτήρια στον κώδικα Python. Μπορείτε να χρησιμοποιήσετε τις ακόλουθες λειτουργίες εξαγωγής σελίδων: 'διαχωρισμός κατά επικεφαλίδες', 'διαίρεση κατά ενότητες', 'διαίρεση σελίδας προς σελίδα', 'διαίρεση κατά εύρος σελίδων'.

Αφού χωρίσετε το έγγραφο, μπορείτε να εξαγάγετε το αποτέλεσμα στην απαιτούμενη μορφή αρχείου χρησιμοποιώντας τη μέθοδο 'Document.Save'. Μπορείτε επίσης να ελέγξετε τον τρόπο εξαγωγής των τμημάτων του εγγράφου σε μορφές HTML ή EPUB χρησιμοποιώντας την ιδιότητα 'DocumentPartSavingCallback', η οποία θα σας επιτρέψει να ανακατευθύνετε ροές εξόδου.

Διαχωρίστε εύκολα έγγραφα με τη λύση μας για το Python via .NET. Το ακόλουθο παράδειγμα δείχνει πώς να χωρίσετε ένα έγγραφο χρησιμοποιώντας το Python:

Παράδειγμα κώδικα στο Python για να χωρίσετε ένα έγγραφο σε μέρη
Ανεβάστε ένα αρχείο που θέλετε να χωρίσετε
Εκτέλεση κώδικα
Επιλέξτε τη μορφή προορισμού από τη λίστα
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Εκτέλεση κώδικα

Πώς να χωρίσετε το Word, το PDF, το HTML και άλλες μορφές αρχείων σε Python

  1. Εγκαταστήστε τη βιβλιοθήκη Python για να χωρίσετε έγγραφα μέσω προγραμματισμού.
  2. Προσθέστε μια αναφορά βιβλιοθήκης (εισαγωγή της βιβλιοθήκης) στο έργο σας Python.
  3. Ανοίξτε το έγγραφο προέλευσης στο Python.
  4. Καλέστε τη μέθοδο extract_pages() για να εξαγάγετε συγκεκριμένες σελίδες από το έγγραφό σας.
  5. Λάβετε το αποτέλεσμα του διαχωρισμού εγγράφων ως ξεχωριστά αρχεία.

Python βιβλιοθήκη για διαχωρισμό αρχείων

Φιλοξενούμε τα πακέτα Python μας στα αποθετήρια PyPi. Ακολουθήστε τις οδηγίες βήμα προς βήμα σχετικά με τον τρόπο εγκατάστασης του "Aspose.Words for Python via .NET" στο περιβάλλον προγραμματιστή σας.

Απαιτήσεις συστήματος

Αυτό το πακέτο είναι συμβατό με Python ≥3.5 και <3.12. Εάν αναπτύσσετε λογισμικό για Linux, ρίξτε μια ματιά στις πρόσθετες απαιτήσεις για gcc και libpython στην Τεκμηρίωση προϊόντος.

Οι πιο δημοφιλείς μορφές αρχείων για διαχωρισμό

5%

Εγγραφείτε στις ενημερώσεις προϊόντων Aspose

Λάβετε μηνιαία ενημερωτικά δελτία και προσφορές απευθείας στο γραμματοκιβώτιό σας.

© Aspose Pty Ltd 2001-2024. Ολα τα δικαιώματα διατηρούνται.