Analyser le fichier DOCX en ligne et extraire le texte via les applications Android
Développez une puissante application utilitaire d’analyse de documents DOCX basée sur Android. Code répertorié pour l’extraction de texte du document DOCX.
Analyser le document DOCX en ligne
- Importez le fichier DOCX à analyser en le téléchargeant.
- Faites-le en cliquant dans la zone de dépôt par glisser-déposer de l’application d’analyseur.
- En fonction de la taille du fichier DOCX et de la vitesse d’Internet, attendez quelques secondes.
- Cliquez sur le bouton « Analyser maintenant » pour analyser le document.
- Téléchargez les fichiers analysés pour les visualiser instantanément.
Extraire le texte du fichier DOCX via l'application Android
- Ajouter une référence de bibliothèque au projet Java
- Charger le fichier DOCX à l’aide de l’objet de classe Document
- Définir des nœuds à l’aide de getLastSection().getChild du type pertinent
- Définir l’ArrayList en publiant les nœuds pertinents
- Définir la collection et itérer pour extraire les informations
Code : Extraire le texte du document DOCX
Document doc = new Document("sourceFile.doc"); | |
Paragraph startPara = (Paragraph) doc.getLastSection().getChild(NodeType.PARAGRAPH, 2, true); | |
Table endTable = (Table) doc.getLastSection().getChild(NodeType.TABLE, 0, true); | |
ArrayList extractedNodes = extractContent(startPara, endTable, true); | |
Collections.reverse(extractedNodes); | |
while (extractedNodes.size() > 0) { | |
endTable.getParentNode().insertAfter((Node) extractedNodes.get(0), endTable); | |
extractedNodes.remove(0); | |
} | |
doc.save("output.doc"); |
Développer une application Android d'analyseur de fichiers DOCX
Besoin de développer une application ou un logiciel d’analyseur DOCX ? Avec
Aspose.Words for Android via Java
, une API enfant de
Aspose.Total for Android via Java
, tout développeur Android peut intégrer le code API ci-dessus dans son application d’analyse de documents. La puissante bibliothèque Android permet de programmer n’importe quelle solution d’analyse de documents pour extraire des images ainsi que du texte. De plus, il peut prendre en charge de nombreux formats populaires, notamment le format DOCX.
Utilitaire Android pour traiter le fichier DOCX pour l'application d'analyseur
- Nous hébergeons nos packages Java en Dépôts Maven .
- Aspose.Words for Java est un fichier JAR commun contenant du byte-code.
- Suivez le instructions étape par étape pour savoir comment installer Aspose.Words for Android via Java.
Configuration requise
- Java SE 7 et les versions Java plus récentes sont prises en charge.
- Package séparé pour Java SE 6 au cas où l’on serait obligé d’utiliser un JRE obsolète.
- Le package Java est multiplateforme et fonctionne sur tous les systèmes d’exploitation avec implémentation JVM.
- Les systèmes d’exploitation incluent Microsoft Windows, Linux, macOS, Android et iOS.
Pour plus de détails sur les dépendances de packages optionnels, telles que JogAmp JOGL, le moteur de polices Harfbuzz, Java Advanced Imaging JAI, veuillez vous référer à [Documentation produit](https://docs.aspose.com/words/java/system-requirements/).