Ελληνικά
  1. Προϊόντα
  2.   Aspose.Total
  3.   Python via .NET
  4.   Parse
  5.   Εξαγωγή κειμένου και εικόνων από το αρχείο DOC Online και χρησιμοποιώντας Python

Αναλύστε το αρχείο DOC Online καθώς και εξαγωγή κειμένου ή εικόνων μέσω Python

Αναπτύξτε μια ισχυρή εφαρμογή βοηθητικού προγράμματος ανάλυσης εγγράφων DOC που βασίζεται στην Python.Παρατίθεται κώδικας για εικόνες εγγράφων DOC και εξαγωγή κειμένου μέσω Python.

Αναλύστε το έγγραφο DOC μέσω της διαδικτυακής εφαρμογής

  1. Εισαγάγετε το αρχείο DOC για ανάλυση ανεβάζοντάς το.
  2. Κάντε το κάνοντας κλικ μέσα στην περιοχή απόθεσης μέσω μεταφοράς και απόθεσης της εφαρμογής ανάλυσης.
  3. Ανάλογα με το μέγεθος του αρχείου DOC και την ταχύτητα του Διαδικτύου, περιμένετε μερικά δευτερόλεπτα.
  4. Κάντε κλικ στο κουμπί “Ανάλυση τώρα” για να αναλύσετε το έγγραφο.
  5. Κάντε λήψη των αναλυμένων αρχείων για άμεση προβολή.

Εξαγωγή κειμένου από το αρχείο DOC μέσω Python

  1. Αναφορά API εντός του έργου απευθείας από το PyPI ( Aspose.Words )
  2. Καθορισμός κόμβων για συμπερίληψη στη διαδικασία εξαγωγής κειμένου
  3. Συμπεριλάβετε ή εξαιρέστε τον πρώτο και τον τελευταίο κόμβο
  4. Εξαγωγή περιεχομένου σε καθορισμένους κόμβους
  5. Δημιουργήστε ένα ξεχωριστό έγγραφο DOC για εξαγόμενο κείμενο
  6. Ο κώδικας παρατίθεται στη συνάρτηση extract_content.
 

Παράδειγμα κώδικα στην Python για εξαγωγή κειμένου εγγράφου DOC

 

Εξαγωγή εικόνων από το αρχείο DOC μέσω Python

  1. Αναφορά API εντός του έργου απευθείας από το PyPI ( Aspose.Words )
  2. Εικόνες αποθηκευμένες σε κόμβους σχήματος του αντικειμένου εγγράφου
  3. Για να επιλέξετε όλους τους κόμβους Shape, χρησιμοποιήστε τη μέθοδο Document.get_child_nodes
  4. Κάντε βρόχο μέσω των συλλογών κόμβων που προκύπτουν
  5. Εάν το Shape.has_image επιστρέψει true.
  6. Χρησιμοποιήστε την ιδιότητα Shape.image_data για να εξαγάγετε δεδομένα εικόνας.
  7. Αποθήκευση δεδομένων εικόνας σε αρχείο
 

Παράδειγμα κώδικα στην Python για εξαγωγή εικόνων εγγράφων DOC

 
 

Αναπτύξτε την εφαρμογή ανάλυσης αρχείων DOC μέσω Python

Χρειάζεστε να αναπτύξετε μια εφαρμογή ή βοηθητικό πρόγραμμα ανάλυσης DOC;Με το Aspose.Words for Python via .NET ένα θυγατρικό API του Aspose.Total for Python via .NET , οποιοσδήποτε προγραμματιστής python μπορεί να ενσωματώσει τον παραπάνω κώδικα API στην εφαρμογή ανάλυσης εγγράφων του.Η ισχυρή βιβλιοθήκη Python επιτρέπει τον προγραμματισμό οποιασδήποτε λύσης ανάλυσης εγγράφων για εξαγωγή εικόνων καθώς και κειμένου.Επιπλέον, μπορεί να υποστηρίξει πολλές δημοφιλείς μορφές, συμπεριλαμβανομένης της μορφής DOC.

Βοηθητικό πρόγραμμα Python για την επεξεργασία αρχείου DOC για εφαρμογή ανάλυσης

Υπάρχουν εναλλακτικές επιλογές για να εγκαταστήσετε το “ Aspose.Words for Python via .NET ” ή το “ Aspose.Total for Python via .NET ” στο σύστημά σας.Επιλέξτε αυτό που μοιάζει με τις ανάγκες σας και ακολουθήστε τις οδηγίες βήμα προς βήμα:

  • Εγκαταστήστε το Aspose.Words for Python via .NET από το PyPI
  • Ή Χρησιμοποιήστε τις ακόλουθες εντολές pip pip install aspose.words.

Απαιτήσεις συστήματος

  • Έχει εγκατασταθεί η Python 3.5 ή νεότερη έκδοση
  • Βιβλιοθήκες χρόνου εκτέλεσης GCC-6 (ή νεότερες).
  • Εξαρτήσεις του .NET Core Runtime. Η εγκατάσταση του ίδιου του .NET Core Runtime ΔΕΝ απαιτείται.
  • Για Python 3.5-3.7: Απαιτείται η κατασκευή pymalloc της Python.

    Για περισσότερες λεπτομέρειες, ανατρέξτε στο Τεκμηρίωση προϊόντος .

Συχνές ερωτήσεις

  • Μπορώ να χρησιμοποιήσω τον παραπάνω κώδικα Python στην εφαρμογή μου;
    Ναι, μπορείτε να κάνετε λήψη αυτού του κώδικα και να τον χρησιμοποιήσετε για την ανάπτυξη εφαρμογής ανάλυσης εγγράφων που βασίζεται σε Python.Αυτός ο κώδικας μπορεί να χρησιμεύσει ως πολύτιμος πόρος για τη βελτίωση της λειτουργικότητας και των δυνατοτήτων των έργων σας στον τομέα της επεξεργασίας εγγράφων υποστήριξης, όπως η ανάγνωση κόμβων και η φόρτωση του εγγράφου για εξαγωγή κειμένου και εικόνων.
  • Αυτή η διαδικτυακή εφαρμογή ανάλυσης εγγράφων λειτουργεί μόνο σε Windows;
    Έχετε την ευελιξία να ξεκινήσετε την ανάλυση εγγράφων σε οποιαδήποτε συσκευή, ανεξάρτητα από το λειτουργικό σύστημα στο οποίο εκτελείται, είτε είναι Windows, Linux, Mac OS ή Android.Το μόνο που απαιτείται είναι ένα σύγχρονο πρόγραμμα περιήγησης και μια ενεργή σύνδεση στο Διαδίκτυο.
  • Είναι ασφαλής η χρήση της διαδικτυακής εφαρμογής για την ανάλυση του εγγράφου DOC;
    Φυσικά! Τα αρχεία εξόδου που δημιουργούνται μέσω της υπηρεσίας μας θα αφαιρεθούν με ασφάλεια και αυτόματα από τους διακομιστές μας εντός 24 ωρών.Ως αποτέλεσμα, οι σύνδεσμοι εμφάνισης που σχετίζονται με αυτά τα αρχεία θα πάψουν να λειτουργούν μετά από αυτήν την περίοδο.
  • Ποιο πρόγραμμα περιήγησης πρέπει να χρησιμοποιήσει την εφαρμογή;
    Μπορείτε να χρησιμοποιήσετε οποιοδήποτε σύγχρονο πρόγραμμα περιήγησης ιστού, όπως το Google Chrome, το Firefox, το Opera ή το Safari για διαδικτυακή ανάλυση εγγράφων DOC.Ωστόσο, εάν αναπτύσσετε μια εφαρμογή επιτραπέζιου υπολογιστή, συνιστούμε να χρησιμοποιήσετε το API επεξεργασίας εγγράφων Aspose.Total για αποτελεσματική διαχείριση.

Εξερευνήστε το Αναλυτής αρχείων Επιλογές με Python

Αναλύω λέξη DOC Αρχεία (Δυαδική μορφή Microsoft Word)
Αναλύω λέξη DOCX Αρχεία (Έγγραφο Word 2007+ Office)
Αναλύω λέξη DOT Αρχεία (Αρχεία προτύπων του Microsoft Word)
Αναλύω λέξη DOTX Αρχεία (Αρχείο προτύπου Microsoft Word)
Αναλύω λέξη ODP Αρχεία (Μορφή παρουσίασης OpenDocument)
Αναλύω λέξη ODT Αρχεία (Μορφή αρχείου κειμένου OpenDocument)
Αναλύω λέξη OTT Αρχεία (Πρότυπο OpenDocument)
Αναλύω λέξη PDF Αρχεία (Μορφή φορητού εγγράφου)
Αναλύω λέξη POWERPOINT Αρχεία (Αρχεία παρουσίασης)
Αναλύω λέξη PPT Αρχεία (Παρουσίαση powerpoint)
Αναλύω λέξη PPTX Αρχεία (Ανοίξτε τη μορφή παρουσίασης XML)
Αναλύω λέξη RTF Αρχεία (Μορφή εμπλουτισμένου κειμένου)
Αναλύω λέξη WORD Αρχεία (Μορφές αρχείων επεξεργασίας κειμένου)