Convertir MHTML en TXT via Python

Conversion de MHTML en TXT Python. Les programmeurs peuvent utiliser cet exemple de code pour exporter MHTML vers TXT dans n’importe quel .NET Framework, .NET Core et PHP, VBScript, C++ via COM Interop.

C# Java C++ Python

Convertir MHTML en TXT dans Python via .NET

Comment convertir MHTML en TXT ? Vous pouvez facilement convertir un document du format MHTML au format TXT par programmation grâce à une API Python moderne de traitement de documents. Quelques lignes de code suffisent pour obtenir des fichiers de haute qualité. La bibliothèque Aspose.PDF permet à tout développeur de convertir facilement MHTML en TXT avec Python.

Pour une description plus détaillée de l’extrait de code et des autres formats de conversion possibles, consultez la Documentation. Vous pouvez également consulter les autres conversions formats pris en charge par notre bibliothèque.

Avec la bibliothèque Aspose.PDF for Python via .NET, vous pouvez convertir MHTML en TXT par programmation. Le logiciel PDF d’Aspose est idéal pour les particuliers, les petites et les grandes entreprises. Capable de traiter un grand volume d’informations, il effectue la conversion rapidement et efficacement, tout en protégeant vos données. Une fonctionnalité particulière d’Aspose.PDF est son API de conversion de MHTML en TXT. Cette approche permet d’ouvrir le gestionnaire de paquets PyPI, de rechercher « aspose-pdf » et de l’installer sans configuration complexe. Pour tester les avantages de la bibliothèque, essayez l’extrait de code de conversion MHTML en TXT. Vous pouvez également utiliser la commande suivante depuis la console ou le terminal :

Console

pip install aspose-pdf

Comment convertir MHTML en TXT

Les développeurs de Python peuvent facilement charger et convertir des fichiers MHTML en TXT en quelques lignes de code.

Importez les modules requis à partir de aspose.pdf bibliothèque, y compris la classe Document pour le chargement des fichiers PDF. Assurez-vous que les bibliothèques nécessaires sont installées et importées avant de continuer.
Spécifiez le chemin d’accès au document PDF d’entrée en joignant indir à infile, en veillant ainsi à ce que la structure de répertoire soit correcte. Cette étape est cruciale pour localiser correctement le fichier d’entrée dans l’arborescence de répertoires spécifiée.
Créez une instance de la classe MhtLoadOptions pour spécifier le format de sortie pour l’enregistrement du document. Ces options contrôlent les caractéristiques du fichier HTML converti. MhtLoadOptions est utilisé pour configurer le comportement du processus de conversion.
Chargez le document PDF d’entrée dans un objet Document à l’aide de apdf. document(). Le document chargé sera utilisé pour le traitement et l’enregistrement dans d’autres formats. Assurez-vous que le fichier PDF est correctement chargé avant de poursuivre le processus de conversion.
Récupérez le nombre total de pages du document PDF chargé à l’aide de la fonction len(). Cette étape fournit des informations essentielles sur le contenu et la disposition du fichier d’entrée.
Créez une instance de la classe TextDevice pour spécifier le type de périphérique utilisé pour le traitement du document, y compris sa résolution, sa profondeur de couleur et d’autres paramètres. Le périphérique choisi affecte la qualité et l’apparence du fichier de sortie généré.
Utilisez le périphérique défini pour traiter une seule page à partir du document PDF chargé, en enregistrant l’image convertie dans le chemin de sortie spécifié. Cette étape génère un nouveau fichier de sortie dans le format spécifié.
Imprime un message de réussite indiquant que la conversion est terminée après l’enregistrement du document converti. Cette étape confirme que le processus de conversion a réussi et que les fichiers de sortie se trouvent aux chemins d’accès spécifiés.

Voici un exemple qui montre comment convertir MHTML en TXT dans Python. Vous pouvez suivre ces étapes simples pour convertir votre fichier MHTML au format TXT. Commencez par charger votre fichier MHTML, puis enregistrez-le simplement en tant que fichier TXT. Vous pouvez utiliser des noms de fichiers complets pour la lecture de MHTML et pour l’écriture de TXT. Le contenu et la mise en forme de la sortie TXT seront identiques à ceux du document MHTML d’origine.

Exemple : Convertir MHTML en TXT via Python

Cet exemple de code montre la conversion de MHTML vers TXT Python

Input file:

Upload a file

File not added

Output format:

TXT

Output file:

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

load_options = apdf.MhtLoadOptions()
document = apdf.Document(path_infile, load_options)
print(len(document.pages))
device = apdf.devices.TextDevice()
device.process(document.pages[1], path_outfile)

print(infile + " converted into " + outfile)

Convertissez MHTML en TXT en utilisant Python via .NET

Aspose.PDF for Python via l’API .NET prend en charge les normes et spécifications PDF les plus établies. Il permet aux développeurs d’insérer des tableaux, des graphiques, des images, des hyperliens, des polices personnalisées, etc., dans des documents PDF. De plus, il est également possible de compresser des documents PDF. Aspose.PDF for Python via .NET fournit d’excellentes fonctionnalités de sécurité pour développer des documents PDF sécurisés. Parmi les principales fonctionnalités de Aspose.PDF for Python via l’API .NET, citons :

Possibilité de lire et d’exporter des PDF dans plusieurs formats d’image, notamment BMP, GIF, JPEG et PNG.
Définissez les informations de base (par exemple, auteur, créateur) du document PDF.
Fonctionnalités de conversion : convertissez des PDF en Word, Excel et PowerPoint. Convertissez les formats PDF en images. Convertissez un fichier PDF au format HTML et vice versa. Convertissez un PDF en EPUB, Text, XPS, etc.

Vous pouvez trouver plus d’informations sur Aspose.PDF for Python via l’API .NET dans notre documentation sur l’utilisation de l’API.