Pour un développeur Python, qui essaie d’ajouter une fonctionnalité de conversion PDF vers MHTML (format d’archive Web) ou HtmlFixed signifie vouloir enregistrer le document au format HTML en utilisant des éléments absolument positionnés dans l’application. L’API Aspose.Total for Python via .NET peut aider à automatiser le processus de conversion. Il s’agit d’un ensemble complet de diverses API traitant de différents formats.
Nous utilisons l’API Aspose.Words for Python via .NET qui fait partie du package Aspose.Total for Python via .NET pour ajouter la fonction de conversion PDF en MHTML. Si le fichier PDF est simple, il ne s’agit que de deux lignes de code. Chargez le fichier PDF et appelez la méthode save avec le chemin de fichier approprié avec l’énumération SaveFormat en tant que MHTML ou HTML_FIXED. Mais dans le cas où il est nécessaire de restaurer le modèle de document aussi proche de celui d’origine, il est nécessaire d’enregistrer des informations supplémentaires dans le document résultant, appelées informations aller-retour.
Comment Convertir PDF en MHTML en Python
- Charger le fichier PDF source à l’aide de la classe Document
- Créez l’instance de HtmlSaveOptions
- Définissez export_roundtrip_information sur True
- Spécifiez SaveFormat comme MHTML
- Appelez la méthode
save
tout en spécifiant le chemin du fichier de sortie et SaveFormat comme paramètres. Ainsi, votre fichier PDF est converti en MHTML au chemin spécifié.
Exigences de conversion
- Pour la conversion du format PDF vers MHTML ou HtmlFixed, Python 3.5 ou version ultérieure est requis
- API de référence dans le projet directement depuis PyPI ( Aspose.Words )
- Ou utilisez les commandes pip suivantes
pip install aspose.words
- De plus, les systèmes d’exploitation basés sur Microsoft Windows ou Linux (voir plus pour Words ) et pour Linux vérifient les exigences supplémentaires pour gcc et libpython et suivent les instructions étape par étape INSTALL