Convertir HTML en TXT via Java

Conversion de HTML vers TXT en Java. Les programmeurs peuvent utiliser cet exemple de code pour exporter HTML vers TXT dans n’importe quelle application Web ou de bureau basée sur Java.

Convertir HTML en TXT dans Java

Comment convertir HTML en TXT ? Vous pouvez facilement convertir par programmation un document du format HTML au format TXT à l’aide d’une API Java moderne de traitement de documents. Utilisez seulement quelques lignes de code Java pour convertir des fichiers de haute qualité. La bibliothèque Aspose.PDF permettra à tout développeur de résoudre efficacement les tâches de conversion de HTML en TXT à l’aide de Java.

Pour une description plus détaillée de l’extrait de code et des autres formats de conversion possibles, consultez les pages Documentation. Vous pouvez également consulter les autres conversions de formats, qui sont pris en charge par notre bibliothèque.

Pour convertir HTML en TXT, nous allons utiliser l’API Aspose.PDF pour Java qui est une API de conversion riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme Java. Vous pouvez télécharger sa dernière version directement depuis Maven et l’installer dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Consultez les détails de l’installation de la bibliothèque sur les pages Documentation.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Comment convertir HTML en TXT


Les développeurs de Java peuvent facilement charger et convertir des fichiers HTML en TXT en quelques lignes de code.

  1. Charger un fichier HTML avec une instance de Document
  2. Appelez la méthode Document.Save en passant le chemin du fichier de sortie et SaveFormat.Txt en tant que paramètres
  3. Le fichier TXT sera enregistré dans le chemin spécifié

Voici un exemple qui montre comment convertir HTML en TXT dans Java. Vous pouvez suivre ces étapes simples pour convertir votre fichier HTML au format TXT. Commencez par charger votre fichier HTML, puis enregistrez-le simplement en tant que fichier TXT. Vous pouvez utiliser des noms de fichiers complets pour la lecture de HTML et pour l’écriture de TXT. Le contenu et la mise en forme de la sortie TXT seront identiques à ceux du document HTML d’origine.

Exemple : Convertir HTML en TXT via Java

Cet exemple de code montre la conversion de HTML vers TXT Java

Input file:

File not added

Output format:

TXT

Output file:

        public static void ConvertHTMLtoTXT()
        {
            // load HTML with an instance of Document
            Document document = new Document("template.html", new HtmlLoadOptions());

            // create an object of TextDevice
            var renderer = new Aspose.Pdf.Devices.TextDevice();

            renderer.Process(document.Pages[1], "output.txt");
        }

Convertissez HTML en TXT à l'aide de la bibliothèque Java

L’API Aspose.PDF pour Java est une bibliothèque qui permet aux développeurs d’ajouter des fonctionnalités de traitement PDF à leurs applications. Il peut être utilisé pour créer tout type d’applications 32 bits et 64 bits afin de générer ou de lire, de convertir et de manipuler des fichiers PDF sans utiliser Adobe Acrobat. Aspose.PDF pour Java permet aux développeurs d’insérer des tableaux, des graphiques, des images, des hyperliens, des polices personnalisées, etc., dans des documents PDF. De plus, il est également possible de compresser un PDF. Aspose.PDF pour Java fournit d’excellentes fonctionnalités de sécurité pour développer des fichiers PDF sécurisés.

Vous trouverez plus d’informations sur l’API Aspose.PDF pour Java sur documentation et sur examples pour savoir comment utiliser l’API. Parmi les principales fonctionnalités de l’API Aspose.PDF pour Java, citons la prise en charge de divers formats de fichiers, notamment HTML, XFA, TXT, PCL, XML, XPS et les formats de fichiers image, la prise en charge de différentes versions PDF et de nombreuses fonctionnalités de liens hypertexte.