Convertir PDF en XML via Python

Conversion de PDF en XML Python. Les programmeurs peuvent utiliser cet exemple de code pour exporter PDF vers XML dans n’importe quel .NET Framework, .NET Core et PHP, VBScript, C++ via COM Interop.

Convertir PDF en XML dans Python via .NET

Comment convertir PDF en XML ? Vous pouvez facilement convertir un document du format PDF au format XML par programmation grâce à une API Python moderne de traitement de documents. Quelques lignes de code suffisent pour obtenir des fichiers de haute qualité. La bibliothèque Aspose.PDF permet à tout développeur de convertir facilement PDF en XML avec Python.

Pour une description plus détaillée de l’extrait de code et des autres formats de conversion possibles, consultez la Documentation. Vous pouvez également consulter les autres conversions formats pris en charge par notre bibliothèque.

Avec la bibliothèque Aspose.PDF for Python via .NET, vous pouvez convertir PDF en XML par programmation. Le logiciel PDF d’Aspose est idéal pour les particuliers, les petites et les grandes entreprises. Capable de traiter un grand volume d’informations, il effectue la conversion rapidement et efficacement, tout en protégeant vos données. Une fonctionnalité particulière d’Aspose.PDF est son API de conversion de PDF en XML. Cette approche permet d’ouvrir le gestionnaire de paquets PyPI, de rechercher « aspose-pdf » et de l’installer sans configuration complexe. Pour tester les avantages de la bibliothèque, essayez l’extrait de code de conversion PDF en XML. Vous pouvez également utiliser la commande suivante depuis la console ou le terminal :

Console

pip install aspose-pdf

Comment convertir PDF en XML

Les développeurs de Python peuvent facilement charger et convertir des fichiers PDF en XML en quelques lignes de code.

Importez les modules requis à partir de aspose.pdf bibliothèque, y compris la classe Document pour le chargement des fichiers PDF. Assurez-vous que les bibliothèques nécessaires sont installées et importées avant de continuer.
Spécifiez le chemin d’accès au document PDF d’entrée en joignant indir à infile, en veillant à ce que la structure de répertoire soit correcte pour localiser correctement le fichier d’entrée.
Créez une instance de l’objet Document et chargez le fichier PDF d’entrée spécifié. Cette étape est nécessaire pour accéder au contenu PDF en vue d’un traitement ultérieur.
Créez une instance de l’objet PdfXmlSaveOptions, qui sera utilisée pour spécifier le format de sortie sous forme de fichier PDF XML. Ce format est utile pour convertir des fichiers PDF complexes avec des mises en page et un formatage dans un format plus modifiable.
Utilisez le document PDF chargé et l’objet PdfXmlSaveOptions créé pour enregistrer le fichier au format PDF XML, ce qui convertira le contenu PDF dans un format XML pouvant être modifié.
Imprimez un message de réussite indiquant que le PDF d’entrée a été converti en fichier PDF XML, ainsi que les noms des fichiers d’entrée et de sortie à titre de référence.

Voici un exemple qui montre comment convertir PDF en XML dans Python. Vous pouvez suivre ces étapes simples pour convertir votre fichier PDF au format XML. Commencez par charger votre fichier PDF, puis enregistrez-le simplement en tant que fichier XML. Vous pouvez utiliser des noms de fichiers complets pour la lecture de PDF et pour l’écriture de XML. Le contenu et la mise en forme de la sortie XML seront identiques à ceux du document PDF d’origine.

Exemple : Convertir PDF en XML via Python

Cet exemple de code montre la conversion de PDF vers XML Python

Input file:

Upload a file

File not added

Output format:

XML

Output file:

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
save_options = apdf.PdfXmlSaveOptions()
document.save(path_outfile, save_options)

print(infile + " converted into " + outfile)

Convertissez PDF en XML en utilisant Python via .NET

Aspose.PDF for Python via l’API .NET prend en charge les normes et spécifications PDF les plus établies. Il permet aux développeurs d’insérer des tableaux, des graphiques, des images, des hyperliens, des polices personnalisées, etc., dans des documents PDF. De plus, il est également possible de compresser des documents PDF. Aspose.PDF for Python via .NET fournit d’excellentes fonctionnalités de sécurité pour développer des documents PDF sécurisés. Parmi les principales fonctionnalités de Aspose.PDF for Python via l’API .NET, citons :

Possibilité de lire et d’exporter des PDF dans plusieurs formats d’image, notamment BMP, GIF, JPEG et PNG.
Définissez les informations de base (par exemple, auteur, créateur) du document PDF.
Fonctionnalités de conversion : convertissez des PDF en Word, Excel et PowerPoint. Convertissez les formats PDF en images. Convertissez un fichier PDF au format HTML et vice versa. Convertissez un PDF en EPUB, Text, XPS, etc.

Vous pouvez trouver plus d’informations sur Aspose.PDF for Python via l’API .NET dans notre documentation sur l’utilisation de l’API.