Μετατροπή DOC σε MHTML χρησιμοποιώντας Python

DOC σε MHTML, HtmlFixed και μετατροπή HTML στις εφαρμογές σας Python χωρίς εγκατάσταση του Microsoft Word®.

 

Για έναν προγραμματιστή Python, ο οποίος προσπαθεί να προσθέσει μια δυνατότητα μετατροπής DOC σε MHTML (Μορφή αρχείου Ιστού) ή HtmlFixed σημαίνει ότι θέλει να αποθηκεύσει το έγγραφο σε μορφή HTML χρησιμοποιώντας απολύτως τοποθετημένα στοιχεία εντός της εφαρμογής. Το Aspose.Total for Python via .NET API μπορεί να βοηθήσει στην αυτοματοποίηση της διαδικασίας μετατροπής. Είναι ένα πλήρες πακέτο διαφόρων API που αφορούν διαφορετικές μορφές.

Χρησιμοποιούμε το Aspose.Words for Python via .NET API που αποτελεί μέρος του πακέτου Aspose.Total for Python via .NET για να προσθέσουμε τη δυνατότητα μετατροπής DOC σε MHTML. Σε περίπτωση που το αρχείο DOC είναι απλό, τότε υπάρχουν μόνο δύο γραμμές κώδικα. Φορτώστε το αρχείο DOC και καλέστε τη μέθοδο αποθήκευσης με την κατάλληλη διαδρομή αρχείου μαζί με την απαρίθμηση SaveFormat ως MHTML ή HTML_FIXED. Αλλά σε περίπτωση που χρειαστεί να επαναφέρετε το μοντέλο του εγγράφου όσο πιο κοντά στο αρχικό, τότε πρέπει να αποθηκεύσετε κάποιες επιπλέον πληροφορίες στο προκύπτον έγγραφο που ονομάζονται πληροφορίες μετ’ επιστροφής.

Πως να Μετατροπή DOC σε MHTML στην Python

  • Φορτώστε το αρχείο προέλευσης DOC χρησιμοποιώντας την κλάση Document
  • Δημιουργήστε την παρουσία του HtmlSaveOptions
  • Ορίστε το export_roundtrip_information ως True
  • Καθορίστε το SaveFormat ως MHTML
  • Καλέστε τη μέθοδο «αποθήκευση» ενώ καθορίζετε τη διαδρομή αρχείου εξόδου και την αποθήκευση μορφοποίησης ως παραμέτρους. Έτσι, το αρχείο DOC μετατρέπεται σε MHTML στην καθορισμένη διαδρομή.

Απαιτήσεις μετατροπής

  • Για μετατροπή μορφής DOC σε MHTML ή HtmlFixed, απαιτείται Python 3.5 ή νεότερη έκδοση
  • Αναφορά API εντός του έργου απευθείας από το PyPI ( Aspose.Words )
  • Ή χρησιμοποιήστε τις ακόλουθες εντολές pip pip install aspose.words
  • Επιπλέον, το λειτουργικό σύστημα Microsoft Windows ή Linux (δείτε περισσότερα για Words ) και για Linux ελέγξτε τις πρόσθετες απαιτήσεις για gcc και libpython και ακολουθήστε τις οδηγίες βήμα προς βήμα INSTALL
 

Αποθήκευση DOC σε MHTML στην Python - Simple

 
 

Μετατροπή DOC σε MHTML στην Python

 

Εξερευνήστε DOC επιλογές μετατροπής με Python

Μετατροπή DOCs σε CSV (Τιμές διαχωρισμένες με κόμμα)
Μετατροπή DOCs σε DIF (Μορφή ανταλλαγής δεδομένων)
Μετατροπή DOCs σε EML (Μήνυμα E-Mail)
Μετατροπή DOCs σε EMLX (Μήνυμα αλληλογραφίας Apple)
Μετατροπή DOCs σε EXCEL (Μορφές αρχείων υπολογιστικών φύλλων)
Μετατροπή DOCs σε FODS (Επίπεδο υπολογιστικό φύλλο OpenDocument XML)
Μετατροπή DOCs σε ICS (Αρχείο Ημερολογίου)
Μετατροπή DOCs σε MBOX (Αρχείο γραμματοκιβωτίου email)
Μετατροπή DOCs σε MSG (Αρχείο στοιχείου μηνύματος του Outlook)
Μετατροπή DOCs σε ODP (Μορφή παρουσίασης OpenDocument)
Μετατροπή DOCs σε ODS (Υπολογιστικό φύλλο OpenDocument)
Μετατροπή DOCs σε OFT (Πρότυπο αρχείου του Outlook)
Μετατροπή DOCs σε OST (Πίνακας αποθήκευσης εκτός σύνδεσης του Outlook)
Μετατροπή DOCs σε POT (Αρχεία προτύπων Microsoft PowerPoint)
Μετατροπή DOCs σε POTM (Αρχείο προτύπου Microsoft PowerPoint)
Μετατροπή DOCs σε POTX (Παρουσίαση προτύπου Microsoft PowerPoint)
Μετατροπή DOCs σε POWERPOINT (Αρχεία παρουσίασης)
Μετατροπή DOCs σε PPS (Παρουσίαση PowerPoint)
Μετατροπή DOCs σε PPSM (Παρουσίαση με δυνατότητα μακροεντολής)
Μετατροπή DOCs σε PPSX (Παρουσίαση PowerPoint)
Μετατροπή DOCs σε PPT (Παρουσίαση powerpoint)
Μετατροπή DOCs σε PPTM (Αρχείο παρουσίασης με δυνατότητα μακροεντολής)
Μετατροπή DOCs σε PPTX (Ανοίξτε τη μορφή παρουσίασης XML)
Μετατροπή DOCs σε PST (Πίνακας προσωπικής αποθήκευσης του Outlook)
Μετατροπή DOCs σε SXC (Υπολογιστικό φύλλο StarOffice Calc)
Μετατροπή DOCs σε TSV (Τιμές διαχωρισμένες με καρτέλες)
Μετατροπή DOCs σε XLAM (Πρόσθετο με δυνατότητα Macro-Enabled)
Μετατροπή DOCs σε XLS (Δυαδική μορφή Microsoft Excel)
Μετατροπή DOCs σε XLSB (Δυαδικό βιβλίο εργασίας του Excel)
Μετατροπή DOCs σε XLSM (Υπολογιστικό φύλλο με δυνατότητα μακροεντολής)
Μετατροπή DOCs σε XLSX (Ανοίξτε το βιβλίο εργασίας XML)
Μετατροπή DOCs σε XLT (Πρότυπο Excel 97 - 2003)
Μετατροπή DOCs σε XLTM (Πρότυπο με δυνατότητα μακροεντολής Excel)
Μετατροπή DOCs σε XLTX (Πρότυπο Excel)

Τι είναι μορφή αρχείου DOC

Το Microsoft Word Binary File Format (DOC) είναι μια ιδιόκτητη μορφή αρχείου εγγράφου που χρησιμοποιείται από το Microsoft Office Word. Αντιπροσωπεύει μια δομή εγγράφου που είναι ανεξάρτητη από οποιαδήποτε συγκεκριμένη αρχιτεκτονική υπολογιστή ή λειτουργικό σύστημα. Η μορφή DOC χρησιμεύει ως αρχείο κοντέινερ, χρησιμοποιώντας μια δυαδική μορφή για την αποθήκευση διαφόρων τύπων δεδομένων, συμπεριλαμβανομένων μορφοποιημένου κειμένου, εικόνων, γραφημάτων και άλλων. Η δυαδική φύση της μορφής DOC την καθιστά μη αναγνώσιμη από τον άνθρωπο, αλλά υπάρχουν αρκετά προγράμματα, όπως το Microsoft Word και το LibreOffice, που μπορούν να διαβάζουν και να γράφουν σε αρχεία DOC.

Η μορφή DOC ήταν αρχικά παρουσιάστηκε στο Word για Windows 2.0 το 1987. Έχει υποστεί αρκετές αναθεωρήσεις από τότε, με την πιο πρόσφατη επανάληψη να είναι η μορφή Office Open XML που εισήχθη στο Office 2007. Ένα από τα βασικά πλεονεκτήματα της μορφής DOC έγκειται στη συμβατότητά της με το Microsoft Word , μια από τις πιο ευρέως χρησιμοποιούμενες εφαρμογές επεξεργασίας κειμένου παγκοσμίως. Αυτή η συμβατότητα επιτρέπει στους χρήστες να δημιουργούν και να τροποποιούν έγγραφα χρησιμοποιώντας το Microsoft Word και να τα μοιράζονται εύκολα με άλλους που χρησιμοποιούν επίσης την εφαρμογή. Επιπλέον, πολλές άλλες εφαρμογές επεξεργασίας κειμένου διαθέτουν τη δυνατότητα ανάγνωσης και εγγραφής στη μορφή DOC, καθιστώντας την μια ευέλικτη επιλογή για σκοπούς κοινής χρήσης εγγράφων.

Η ευρεία υιοθέτηση της μορφής DOC πηγάζει από την ενσωμάτωσή της με το Microsoft Word , παρέχοντας στους χρήστες ένα ισχυρό και πλούσιο σε δυνατότητες περιβάλλον για τη δημιουργία και τη διαχείριση εγγράφων. Η ευελιξία της μορφής εκτείνεται πέρα από το Microsoft Word, επιτρέποντας στους χρήστες να εργάζονται με αρχεία DOC χρησιμοποιώντας εναλλακτικό λογισμικό επεξεργασίας κειμένου. Αυτή η ευελιξία εξασφαλίζει απρόσκοπτη συνεργασία εγγράφων και εναλλαξιμότητα μεταξύ των χρηστών, ανεξάρτητα από την επιλεγμένη εφαρμογή επεξεργασίας κειμένου.

Τι είναι μορφή αρχείου MHTML

Το MHTML, συντομογραφία του MIME HTML, είναι μια μορφή αρχείου που συνδυάζει τον κώδικα HTML και τους σχετικούς πόρους του σε ένα ενιαίο αρχείο. Αντιπροσωπεύει το Multipurpose Internet Mail Extension HTML. Τα αρχεία MHTML χρησιμοποιούνται συνήθως για την αποθήκευση ιστοσελίδων, συμπεριλαμβανομένου όλου του περιεχομένου τους, όπως εικόνες, φύλλα στυλ CSS και JavaScript, σε ένα μόνο αρχείο.

Τα αρχεία MHTML δημιουργούνται συχνά από προγράμματα περιήγησης ιστού όταν οι χρήστες αποθηκεύουν ιστοσελίδες για εκτός σύνδεσης σκοπούς προβολής ή αρχειοθέτησης. Συνδυάζοντας όλους τους απαραίτητους πόρους σε ένα αρχείο, η MHTML διασφαλίζει ότι η ιστοσελίδα μπορεί να προβληθεί και να αποδοθεί με ακρίβεια, ακόμη και χωρίς σύνδεση στο διαδίκτυο ή πρόσβαση στον αρχικό διακομιστή.

Η μορφή MHTML ακολουθεί το πρότυπο MIME, το οποίο χρησιμοποιείται για την κωδικοποίηση και την ανταλλαγή διαφόρων τύπων δεδομένων μέσω του Διαδικτύου. Χρησιμοποιεί πολυμερή κωδικοποίηση MIME για να συσκευάσει τον κώδικα HTML και τους σχετικούς πόρους σε ένα μόνο αρχείο. Το αρχείο έχει συνήθως επέκταση αρχείου .mht ή .mhtml.

Τα αρχεία MHTML μπορούν να ανοίξουν και να προβληθούν από προγράμματα περιήγησης ιστού που υποστηρίζουν τη μορφή, όπως ο Internet Explorer, ο Microsoft Edge και ο Opera. Ορισμένα προγράμματα επεξεργασίας κειμένου και εξειδικευμένο λογισμικό παρέχουν επίσης τη δυνατότητα ανοίγματος και επεξεργασίας αρχείων MHTML.

Η μορφή MHTML προσφέρει πλεονεκτήματα όσον αφορά τη φορητότητα και την ευκολία, καθώς επιτρέπει στους χρήστες να αποθηκεύουν και να μοιράζονται ιστοσελίδες ως ένα μόνο αρχείο, διασφαλίζοντας τη διατήρηση της διάταξης, της μορφοποίησης και των συνδεδεμένων πόρων της σελίδας. Ωστόσο, αξίζει να σημειωθεί ότι το MHTML δεν χρησιμοποιείται τόσο ευρέως όσο άλλες μορφές ιστού, όπως το HTML ή το PDF, και η συμβατότητα μπορεί να διαφέρει ανάλογα με το λογισμικό και τις πλατφόρμες.