Μετατροπή WORD σε MHTML χρησιμοποιώντας Python

WORD σε MHTML, HtmlFixed και μετατροπή HTML στις εφαρμογές σας Python χωρίς εγκατάσταση του Microsoft Word®.

 

Για έναν προγραμματιστή Python, ο οποίος προσπαθεί να προσθέσει μια δυνατότητα μετατροπής WORD σε MHTML (Μορφή αρχείου Ιστού) ή HtmlFixed σημαίνει ότι θέλει να αποθηκεύσει το έγγραφο σε μορφή HTML χρησιμοποιώντας απολύτως τοποθετημένα στοιχεία εντός της εφαρμογής. Το Aspose.Total for Python via .NET API μπορεί να βοηθήσει στην αυτοματοποίηση της διαδικασίας μετατροπής. Είναι ένα πλήρες πακέτο διαφόρων API που αφορούν διαφορετικές μορφές.

Χρησιμοποιούμε το Aspose.Words for Python via .NET API που αποτελεί μέρος του πακέτου Aspose.Total for Python via .NET για να προσθέσουμε τη δυνατότητα μετατροπής WORD σε MHTML. Σε περίπτωση που το αρχείο WORD είναι απλό, τότε υπάρχουν μόνο δύο γραμμές κώδικα. Φορτώστε το αρχείο WORD και καλέστε τη μέθοδο αποθήκευσης με την κατάλληλη διαδρομή αρχείου μαζί με την απαρίθμηση SaveFormat ως MHTML ή HTML_FIXED. Αλλά σε περίπτωση που χρειαστεί να επαναφέρετε το μοντέλο του εγγράφου όσο πιο κοντά στο αρχικό, τότε πρέπει να αποθηκεύσετε κάποιες επιπλέον πληροφορίες στο προκύπτον έγγραφο που ονομάζονται πληροφορίες μετ’ επιστροφής.

Πως να Μετατροπή WORD σε MHTML στην Python

  • Φορτώστε το αρχείο προέλευσης WORD χρησιμοποιώντας την κλάση Document
  • Δημιουργήστε την παρουσία του HtmlSaveOptions
  • Ορίστε το export_roundtrip_information ως True
  • Καθορίστε το SaveFormat ως MHTML
  • Καλέστε τη μέθοδο «αποθήκευση» ενώ καθορίζετε τη διαδρομή αρχείου εξόδου και την αποθήκευση μορφοποίησης ως παραμέτρους. Έτσι, το αρχείο WORD μετατρέπεται σε MHTML στην καθορισμένη διαδρομή.

Απαιτήσεις μετατροπής

  • Για μετατροπή μορφής WORD σε MHTML ή HtmlFixed, απαιτείται Python 3.5 ή νεότερη έκδοση
  • Αναφορά API εντός του έργου απευθείας από το PyPI ( Aspose.Words )
  • Ή χρησιμοποιήστε τις ακόλουθες εντολές pip pip install aspose.words
  • Επιπλέον, το λειτουργικό σύστημα Microsoft Windows ή Linux (δείτε περισσότερα για Words ) και για Linux ελέγξτε τις πρόσθετες απαιτήσεις για gcc και libpython και ακολουθήστε τις οδηγίες βήμα προς βήμα INSTALL
 

Αποθήκευση WORD σε MHTML στην Python - Simple

 
 

Μετατροπή WORD σε MHTML στην Python

 

Εξερευνήστε WORD επιλογές μετατροπής με Python

Μετατροπή WORDs σε CSV (Τιμές διαχωρισμένες με κόμμα)
Μετατροπή WORDs σε DIF (Μορφή ανταλλαγής δεδομένων)
Μετατροπή WORDs σε EML (Μήνυμα E-Mail)
Μετατροπή WORDs σε EMLX (Μήνυμα αλληλογραφίας Apple)
Μετατροπή WORDs σε EXCEL (Μορφές αρχείων υπολογιστικών φύλλων)
Μετατροπή WORDs σε FODS (Επίπεδο υπολογιστικό φύλλο OpenDocument XML)
Μετατροπή WORDs σε ICS (Αρχείο Ημερολογίου)
Μετατροπή WORDs σε MBOX (Αρχείο γραμματοκιβωτίου email)
Μετατροπή WORDs σε MSG (Αρχείο στοιχείου μηνύματος του Outlook)
Μετατροπή WORDs σε ODP (Μορφή παρουσίασης OpenDocument)
Μετατροπή WORDs σε ODS (Υπολογιστικό φύλλο OpenDocument)
Μετατροπή WORDs σε OFT (Πρότυπο αρχείου του Outlook)
Μετατροπή WORDs σε OST (Πίνακας αποθήκευσης εκτός σύνδεσης του Outlook)
Μετατροπή WORDs σε POT (Αρχεία προτύπων Microsoft PowerPoint)
Μετατροπή WORDs σε POTM (Αρχείο προτύπου Microsoft PowerPoint)
Μετατροπή WORDs σε POTX (Παρουσίαση προτύπου Microsoft PowerPoint)
Μετατροπή WORDs σε POWERPOINT (Αρχεία παρουσίασης)
Μετατροπή WORDs σε PPS (Παρουσίαση PowerPoint)
Μετατροπή WORDs σε PPSM (Παρουσίαση με δυνατότητα μακροεντολής)
Μετατροπή WORDs σε PPSX (Παρουσίαση PowerPoint)
Μετατροπή WORDs σε PPT (Παρουσίαση powerpoint)
Μετατροπή WORDs σε PPTM (Αρχείο παρουσίασης με δυνατότητα μακροεντολής)
Μετατροπή WORDs σε PPTX (Ανοίξτε τη μορφή παρουσίασης XML)
Μετατροπή WORDs σε PST (Πίνακας προσωπικής αποθήκευσης του Outlook)
Μετατροπή WORDs σε SXC (Υπολογιστικό φύλλο StarOffice Calc)
Μετατροπή WORDs σε TSV (Τιμές διαχωρισμένες με καρτέλες)
Μετατροπή WORDs σε XLAM (Πρόσθετο με δυνατότητα Macro-Enabled)
Μετατροπή WORDs σε XLS (Δυαδική μορφή Microsoft Excel)
Μετατροπή WORDs σε XLSB (Δυαδικό βιβλίο εργασίας του Excel)
Μετατροπή WORDs σε XLSM (Υπολογιστικό φύλλο με δυνατότητα μακροεντολής)
Μετατροπή WORDs σε XLSX (Ανοίξτε το βιβλίο εργασίας XML)
Μετατροπή WORDs σε XLT (Πρότυπο Excel 97 - 2003)
Μετατροπή WORDs σε XLTM (Πρότυπο με δυνατότητα μακροεντολής Excel)
Μετατροπή WORDs σε XLTX (Πρότυπο Excel)

Τι είναι μορφή αρχείου WORD

Το Microsoft Word, ένα ευρέως χρησιμοποιούμενο λογισμικό επεξεργασίας κειμένου, προσφέρει μια σειρά από μορφές αρχείων για αποθήκευση και κοινή χρήση εγγράφων. Η προεπιλεγμένη μορφή είναι DOC, η οποία ήταν διαδεδομένη σε προηγούμενες εκδόσεις του Word. Ωστόσο, η νεότερη και πιο αποτελεσματική μορφή, το DOCX, έχει γίνει η προεπιλεγμένη επιλογή λόγω του μικρότερου μεγέθους αρχείου και των βελτιωμένων δυνατοτήτων ανάκτησης δεδομένων. Το PDF αποτελεί μια άλλη συνήθως χρησιμοποιούμενη μορφή που διατηρεί τη μορφοποίηση και τη διάταξη, ενώ παραμένει εύκολα ορατό σε οποιαδήποτε συσκευή.

Για συμβατότητα με διαφορετικές εφαρμογές λογισμικού, η μορφή RTF χρησιμεύει ως μορφή απλού κειμένου που μπορεί να ανταλλάσσεται εύκολα. Η HTML, από την άλλη πλευρά, χρησιμοποιείται ειδικά για τη δημιουργία ιστοσελίδων. Το ODT, μια μορφή ανοιχτού κώδικα, εξασφαλίζει συμβατότητα με διάφορες εφαρμογές λογισμικού, ενώ το TXT είναι μια απλή μορφή απλού κειμένου που περιέχει μόνο το ίδιο το κείμενο.

Η επιλογή της κατάλληλης μορφής εξαρτάται από πολλούς παράγοντες, συμπεριλαμβανομένης της προβλεπόμενης εφαρμογής, της συμβατότητας με άλλο λογισμικό, καθώς και το μέγεθος και την πολυπλοκότητα του εγγράφου. Με την εξοικείωση με τις διαθέσιμες μορφές, οι χρήστες μπορούν να βελτιστοποιήσουν τη ροή εργασίας τους και να λάβουν τεκμηριωμένες αποφάσεις σχετικά με την καταλληλότερη μορφή για το συγκεκριμένο έγγραφό τους.

Τι είναι μορφή αρχείου MHTML

Το MHTML, συντομογραφία του MIME HTML, είναι μια μορφή αρχείου που συνδυάζει τον κώδικα HTML και τους σχετικούς πόρους του σε ένα ενιαίο αρχείο. Αντιπροσωπεύει το Multipurpose Internet Mail Extension HTML. Τα αρχεία MHTML χρησιμοποιούνται συνήθως για την αποθήκευση ιστοσελίδων, συμπεριλαμβανομένου όλου του περιεχομένου τους, όπως εικόνες, φύλλα στυλ CSS και JavaScript, σε ένα μόνο αρχείο.

Τα αρχεία MHTML δημιουργούνται συχνά από προγράμματα περιήγησης ιστού όταν οι χρήστες αποθηκεύουν ιστοσελίδες για εκτός σύνδεσης σκοπούς προβολής ή αρχειοθέτησης. Συνδυάζοντας όλους τους απαραίτητους πόρους σε ένα αρχείο, η MHTML διασφαλίζει ότι η ιστοσελίδα μπορεί να προβληθεί και να αποδοθεί με ακρίβεια, ακόμη και χωρίς σύνδεση στο διαδίκτυο ή πρόσβαση στον αρχικό διακομιστή.

Η μορφή MHTML ακολουθεί το πρότυπο MIME, το οποίο χρησιμοποιείται για την κωδικοποίηση και την ανταλλαγή διαφόρων τύπων δεδομένων μέσω του Διαδικτύου. Χρησιμοποιεί πολυμερή κωδικοποίηση MIME για να συσκευάσει τον κώδικα HTML και τους σχετικούς πόρους σε ένα μόνο αρχείο. Το αρχείο έχει συνήθως επέκταση αρχείου .mht ή .mhtml.

Τα αρχεία MHTML μπορούν να ανοίξουν και να προβληθούν από προγράμματα περιήγησης ιστού που υποστηρίζουν τη μορφή, όπως ο Internet Explorer, ο Microsoft Edge και ο Opera. Ορισμένα προγράμματα επεξεργασίας κειμένου και εξειδικευμένο λογισμικό παρέχουν επίσης τη δυνατότητα ανοίγματος και επεξεργασίας αρχείων MHTML.

Η μορφή MHTML προσφέρει πλεονεκτήματα όσον αφορά τη φορητότητα και την ευκολία, καθώς επιτρέπει στους χρήστες να αποθηκεύουν και να μοιράζονται ιστοσελίδες ως ένα μόνο αρχείο, διασφαλίζοντας τη διατήρηση της διάταξης, της μορφοποίησης και των συνδεδεμένων πόρων της σελίδας. Ωστόσο, αξίζει να σημειωθεί ότι το MHTML δεν χρησιμοποιείται τόσο ευρέως όσο άλλες μορφές ιστού, όπως το HTML ή το PDF, και η συμβατότητα μπορεί να διαφέρει ανάλογα με το λογισμικό και τις πλατφόρμες.