Convertir PDF en HTML via Python

Conversion de PDF en HTML Python. Les programmeurs peuvent utiliser cet exemple de code pour exporter PDF vers HTML dans n’importe quel .NET Framework, .NET Core et PHP, VBScript, C++ via COM Interop.

Convertir PDF en HTML dans Python via .NET

Comment convertir PDF en HTML ? Vous pouvez facilement convertir un document du format PDF au format HTML par programmation grâce à une API Python moderne de traitement de documents. Quelques lignes de code suffisent pour obtenir des fichiers de haute qualité. La bibliothèque Aspose.PDF permet à tout développeur de convertir facilement PDF en HTML avec Python.

Pour une description plus détaillée de l’extrait de code et des autres formats de conversion possibles, consultez la Documentation. Vous pouvez également consulter les autres conversions formats pris en charge par notre bibliothèque.

Avec la bibliothèque Aspose.PDF for Python via .NET, vous pouvez convertir PDF en HTML par programmation. Le logiciel PDF d’Aspose est idéal pour les particuliers, les petites et les grandes entreprises. Capable de traiter un grand volume d’informations, il effectue la conversion rapidement et efficacement, tout en protégeant vos données. Une fonctionnalité particulière d’Aspose.PDF est son API de conversion de PDF en HTML. Cette approche permet d’ouvrir le gestionnaire de paquets PyPI, de rechercher « aspose-pdf » et de l’installer sans configuration complexe. Pour tester les avantages de la bibliothèque, essayez l’extrait de code de conversion PDF en HTML. Vous pouvez également utiliser la commande suivante depuis la console ou le terminal :

Console

pip install aspose-pdf

Comment convertir PDF en HTML

Les développeurs de Python peuvent facilement charger et convertir des fichiers PDF en HTML en quelques lignes de code.

Importez les modules requis à partir de aspose.pdf bibliothèque, y compris la classe Document pour le chargement des fichiers PDF. Assurez-vous que les bibliothèques nécessaires sont installées et importées avant de continuer.
Spécifiez le chemin d’accès au document PDF d’entrée en joignant indir à infile, en veillant à ce que la structure de répertoire soit correcte pour localiser correctement le fichier d’entrée.
Chargez le document PDF d’entrée dans un objet Document à l’aide de apdf. Document(), permettant l’accès à ses fonctionnalités et propriétés pour le traitement ou la manipulation.
Créez une instance de HtmlSaveOptions, en spécifiant les paramètres d’enregistrement du document PDF au format HTML. Cela détermine la structure et la mise en page du fichier HTML généré.
Utilisez l’objet Document chargé pour enregistrer le document PDF d’entrée au format HTML, en utilisant l’instance HtmlSaveOptions spécifiée comme paramètre pour la méthode d’enregistrement. Cela génère un fichier HTML contenant le contenu du document PDF d’origine.
Imprimez un message de réussite indiquant que le PDF d’entrée a été converti en fichier HTML, fournissant des commentaires sur l’achèvement du processus de conversion et le résultat final.

Voici un exemple qui montre comment convertir PDF en HTML dans Python. Vous pouvez suivre ces étapes simples pour convertir votre fichier PDF au format HTML. Commencez par charger votre fichier PDF, puis enregistrez-le simplement en tant que fichier HTML. Vous pouvez utiliser des noms de fichiers complets pour la lecture de PDF et pour l’écriture de HTML. Le contenu et la mise en forme de la sortie HTML seront identiques à ceux du document PDF d’origine.

Exemple : Convertir PDF en HTML via Python

Cet exemple de code montre la conversion de PDF vers HTML Python

Input file:

Upload a file

File not added

Output format:

HTML

Output file:

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)
document = apdf.Document(path_infile)
save_options = apdf.HtmlSaveOptions()
document.save(path_outfile, save_options)

print(infile + " converted into " + outfile)

Convertissez PDF en HTML en utilisant Python via .NET

Aspose.PDF for Python via l’API .NET prend en charge les normes et spécifications PDF les plus établies. Il permet aux développeurs d’insérer des tableaux, des graphiques, des images, des hyperliens, des polices personnalisées, etc., dans des documents PDF. De plus, il est également possible de compresser des documents PDF. Aspose.PDF for Python via .NET fournit d’excellentes fonctionnalités de sécurité pour développer des documents PDF sécurisés. Parmi les principales fonctionnalités de Aspose.PDF for Python via l’API .NET, citons :

Possibilité de lire et d’exporter des PDF dans plusieurs formats d’image, notamment BMP, GIF, JPEG et PNG.
Définissez les informations de base (par exemple, auteur, créateur) du document PDF.
Fonctionnalités de conversion : convertissez des PDF en Word, Excel et PowerPoint. Convertissez les formats PDF en images. Convertissez un fichier PDF au format HTML et vice versa. Convertissez un PDF en EPUB, Text, XPS, etc.

Vous pouvez trouver plus d’informations sur Aspose.PDF for Python via l’API .NET dans notre documentation sur l’utilisation de l’API.