Convertir PDF en TXT via Python

Conversion de PDF vers TXT en Python. Les programmeurs peuvent utiliser cet exemple de code pour exporter PDF vers TXT dans n’importe quel .NET Framework, .NET Core et PHP, VBScript, Delphi, C++ via COM Interop.

Convertir PDF en TXT dans Python for .NET

Comment convertir PDF en TXT ? Vous pouvez facilement convertir par programmation un document du format PDF au format TXT à l’aide d’une API Python moderne de traitement de documents. Utilisez seulement quelques lignes de code pour convertir des fichiers de haute qualité. La bibliothèque Aspose.PDF permettra à tout développeur de résoudre facilement les tâches de conversion de PDF en TXT à l’aide de Python.

Pour une description plus détaillée de l’extrait de code et des autres formats de conversion possibles, consultez les pages Documentation. Vous pouvez également consulter les autres conversions de formats, qui sont pris en charge par notre bibliothèque.

La bibliothèque Aspose.PDF for .NET vous permet de convertir PDF en TXT par programmation. Le logiciel PDF d’Aspose est idéal pour les particuliers, les petites ou les grandes entreprises. Comme il est capable de traiter une grande quantité d’informations, effectuez la conversion rapidement et efficacement et protégez vos données. Une fonctionnalité particulière de Aspose.PDF est une API permettant de convertir PDF en TXT. La particularité de cette approche est qu’il suffit d’ouvrir le gestionnaire de packages NuGet, de rechercher « Aspose.PDF for .NET » et de l’installer sans paramètres complexes particuliers. (Utilisez la commande depuis la console du gestionnaire de packages pour l’installation). Pour vérifier les avantages de la bibliothèque, essayez d’utiliser l’extrait de code de conversion PDF en TXT. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages :

Python Package Manager Console

pip install aspose-pdf

Comment convertir PDF en TXT


Les développeurs de Python for .NET peuvent facilement charger et convertir des fichiers PDF en TXT en quelques lignes de code.

  1. Initialiser un nouveau document
  2. Créer et définir l’instance de la classe TextDevice avec Size & Resolution
  3. Appelez la méthode TextDevice.Process avec l’index de page et le chemin du fichier de sortie
  4. Enfin, enregistrez le fichier TXT de sortie

Voici un exemple qui montre comment convertir PDF en TXT dans Python. Vous pouvez suivre ces étapes simples pour convertir votre fichier PDF au format TXT. Commencez par charger votre fichier PDF, puis enregistrez-le simplement en tant que fichier TXT. Vous pouvez utiliser des noms de fichiers complets pour la lecture de PDF et pour l’écriture de TXT. Le contenu et la mise en forme de la sortie TXT seront identiques à ceux du document PDF d’origine.

Exemple : Convertir PDF en TXT via Python

Cet exemple de code montre la conversion de PDF vers TXT Python

Input file:

File not added

Output format:

TXT

Output file:

    def convert_PDF_to_TXT(self, infile, outfile):

        path_infile = self.dataDir + infile
        path_outfile = self.dataDir + outfile

        # Open PDF document

        document = Document(path_infile)

        # Create Text device

        textDevice = TextDevice()

        # Convert a particular page and save the image to stream

        textDevice.Process(document, path_outfile)

        print(infile + " converted into " + outfile)

Convertissez PDF en TXT à l'aide de la bibliothèque Python for .NET

Aspose.PDF pour Python via l’API .NET prend en charge les normes et spécifications PDF les plus établies. Il permet aux développeurs d’insérer des tableaux, des graphiques, des images, des hyperliens, des polices personnalisées, etc., dans des documents PDF. De plus, il est également possible de compresser des documents PDF. Aspose.PDF pour Python via .NET fournit d’excellentes fonctionnalités de sécurité pour développer des documents PDF sécurisés. Parmi les principales fonctionnalités de Aspose.PDF pour Python via l’API .NET, citons :

  • Possibilité de lire et d’exporter des PDF dans plusieurs formats d’image, notamment BMP, GIF, JPEG et PNG.
  • Définissez les informations de base (par exemple, auteur, créateur) du document PDF.
  • Fonctionnalités de conversion : convertissez des PDF en Word, Excel et PowerPoint. Convertissez les formats PDF en images. Convertissez un fichier PDF au format HTML et vice versa. Convertissez un PDF en EPUB, Text, XPS, etc.

Vous pouvez trouver plus d’informations sur Aspose.PDF pour Python via l’API .NET dans notre documentation sur l’utilisation de l’API.