Convertir WORD en MHTML en utilisant Python

Conversion WORD en MHTML, HtmlFixed et HTML dans vos applications Python sans installer Microsoft Word®.

 

Pour un développeur Python, qui essaie d’ajouter une fonctionnalité de conversion WORD vers MHTML (format d’archive Web) ou HtmlFixed signifie vouloir enregistrer le document au format HTML en utilisant des éléments absolument positionnés dans l’application. L’API Aspose.Total for Python via .NET peut aider à automatiser le processus de conversion. Il s’agit d’un ensemble complet de diverses API traitant de différents formats.

Nous utilisons l’API Aspose.Words for Python via .NET qui fait partie du package Aspose.Total for Python via .NET pour ajouter la fonction de conversion WORD en MHTML. Si le fichier WORD est simple, il ne s’agit que de deux lignes de code. Chargez le fichier WORD et appelez la méthode save avec le chemin de fichier approprié avec l’énumération SaveFormat en tant que MHTML ou HTML_FIXED. Mais dans le cas où il est nécessaire de restaurer le modèle de document aussi proche de celui d’origine, il est nécessaire d’enregistrer des informations supplémentaires dans le document résultant, appelées informations aller-retour.

Comment Convertir WORD en MHTML en Python

  • Charger le fichier WORD source à l’aide de la classe Document
  • Créez l’instance de HtmlSaveOptions
  • Définissez export_roundtrip_information sur True
  • Spécifiez SaveFormat comme MHTML
  • Appelez la méthode save tout en spécifiant le chemin du fichier de sortie et SaveFormat comme paramètres. Ainsi, votre fichier WORD est converti en MHTML au chemin spécifié.

Exigences de conversion

  • Pour la conversion du format WORD vers MHTML ou HtmlFixed, Python 3.5 ou version ultérieure est requis
  • API de référence dans le projet directement depuis PyPI ( Aspose.Words )
  • Ou utilisez les commandes pip suivantes pip install aspose.words
  • De plus, les systèmes d’exploitation basés sur Microsoft Windows ou Linux (voir plus pour Words ) et pour Linux vérifient les exigences supplémentaires pour gcc et libpython et suivent les instructions étape par étape INSTALL
 

Enregistrer WORD en MHTML en Python - Simple

 
 

Conversion WORD en MHTML en Python

 

Explorez WORD options de conversion avec Python

Convertir WORDs en CSV (Valeurs séparées par des virgules)
Convertir WORDs en DIF (Format d'échange de données)
Convertir WORDs en EMAIL (Envoyer des fichiers par e-mail)
Convertir WORDs en EML (Message électronique)
Convertir WORDs en EMLX (Messagerie Apple)
Convertir WORDs en EXCEL (Formats de fichier de feuille de calcul)
Convertir WORDs en FODS (Feuille de calcul XML plate OpenDocument)
Convertir WORDs en ICS (Fichier de calendrier)
Convertir WORDs en MBOX (Fichier de boîte aux lettres électronique)
Convertir WORDs en MSG (Fichier d'élément de message Outlook)
Convertir WORDs en ODP (Format de présentation OpenDocument)
Convertir WORDs en ODS (Feuille de calcul OpenDocument)
Convertir WORDs en OFT (Modèle de fichier Outlook)
Convertir WORDs en OST (Tableau de stockage hors ligne Outlook)
Convertir WORDs en POT (Fichiers de modèle Microsoft PowerPoint)
Convertir WORDs en POTM (Fichier de modèle Microsoft PowerPoint)
Convertir WORDs en POTX (Modèle de présentation Microsoft PowerPoint)
Convertir WORDs en POWERPOINT (Fichiers de présentation)
Convertir WORDs en PPS (Diaporama PowerPoint)
Convertir WORDs en PPSM (Diaporama compatible avec les macros)
Convertir WORDs en PPSX (Diaporama PowerPoint)
Convertir WORDs en PPT (Présentation Powerpoint)
Convertir WORDs en PPTM (Fichier de présentation prenant en charge les macros)
Convertir WORDs en PPTX (Format de présentation XML ouvert)
Convertir WORDs en PST (Tableau de stockage personnel Outlook)
Convertir WORDs en SXC (Feuille de calcul StarOffice Calc)
Convertir WORDs en TSV (Valeurs séparées par des tabulations)
Convertir WORDs en VCF (Fichier vCard)
Convertir WORDs en XLAM (Complément Excel prenant en charge les macros)
Convertir WORDs en XLS (Format binaire Microsoft Excel)
Convertir WORDs en XLSB (Classeur binaire Excel)
Convertir WORDs en XLSM (Feuille de calcul prenant en charge les macros)
Convertir WORDs en XLSX (Ouvrir le classeur XML)
Convertir WORDs en XLT (Excel 97 - Modèle 2003)
Convertir WORDs en XLTM (Modèle Excel compatible avec les macros)
Convertir WORDs en XLTX (Modèle Excel)

Qu'est-ce que le format de fichier WORD

Microsoft Word, un logiciel de traitement de texte largement utilisé, offre une gamme de formats de fichiers pour enregistrer et partager des documents. Le format par défaut est DOC, qui prévalait dans les versions antérieures de Word. Cependant, le format le plus récent et le plus efficace, DOCX, est devenu le choix par défaut en raison de sa taille de fichier plus petite et de ses capacités de récupération de données améliorées. PDF est un autre format couramment utilisé qui préserve le formatage et la mise en page tout en restant facilement visible sur n’importe quel appareil.

Pour la compatibilité avec différentes applications logicielles, le format RTF sert de format de texte brut qui peut être facilement échangé. HTML, d’autre part, est utilisé spécifiquement pour créer des pages Web. ODT, un format open source, assure la compatibilité avec diverses applications logicielles, tandis que TXT est un format de texte simple contenant uniquement le texte lui-même.

La sélection du format approprié dépend de plusieurs facteurs, notamment l’application prévue, la compatibilité avec d’autres logiciels, ainsi que la taille et la complexité du document. En se familiarisant avec les formats disponibles, les utilisateurs peuvent optimiser leur flux de travail et prendre des décisions éclairées concernant le format le plus adapté à leur document spécifique.

Qu'est-ce que le format de fichier MHTML

MHTML, abréviation de MIME HTML, est un format de fichier qui combine le code HTML et ses ressources associées dans un seul fichier. Il signifie Multipurpose Internet Mail Extension HTML. Les fichiers MHTML sont couramment utilisés pour enregistrer des pages Web, y compris tout leur contenu, comme des images, des feuilles de style CSS et JavaScript, dans un seul fichier.

Les fichiers MHTML sont souvent créés par les navigateurs Web lorsque les utilisateurs enregistrent des pages Web hors connexion. à des fins de visualisation ou d’archivage. En regroupant toutes les ressources nécessaires dans un seul fichier, MHTML garantit que la page Web peut être visualisée et restituée avec précision, même sans connexion Internet ni accès au serveur d’origine.

Le format MHTML suit la norme MIME, qui est utilisé pour encoder et échanger divers types de données sur Internet. Il utilise le codage MIME en plusieurs parties pour regrouper le code HTML et les ressources associées dans un seul fichier. Le fichier a généralement une extension de fichier .mht ou .mhtml.

Les fichiers MHTML peuvent être ouverts et affichés par les navigateurs Web prenant en charge le format, tels qu’Internet Explorer, Microsoft Edge et Opera. Certains éditeurs de texte et logiciels spécialisés offrent également la possibilité d’ouvrir et de modifier des fichiers MHTML.

Le format MHTML offre des avantages en termes de portabilité et de commodité, car il permet aux utilisateurs d’enregistrer et de partager des pages Web dans un seul fichier, assurer la préservation de la mise en page, du formatage et des ressources liées de la page. Cependant, il convient de noter que MHTML n’est pas aussi largement utilisé que d’autres formats Web tels que HTML ou PDF, et la compatibilité peut varier selon les différents logiciels et plates-formes.