Extraire du texte d’un PDF en JavaScript
Comment extraire du texte d’un PDF à l’aide de la bibliothèque Node.js via C++
Comment extraire du texte d'un PDF à l'aide de la bibliothèque Node.js via C++
Pour extraire un fichier texte PDF, nous utiliserons l’API Aspose.PDF for .NET qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plateforme nodejs-cpp. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez-le. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages.
Extraire du texte d’un PDF en JavaScript
Vous avez besoin de bibliothèque Aspose.PDF pour essayer le code dans votre environnement.
- Chargez le PDF avec une instance de Document.
- Créez un objet TextAbsorber pour extraire du texte.
- Acceptez l’absorbeur pour toutes les pages.
- Obtenir le texte extrait
- Créez un rédacteur et ouvrez le fichier, écrivez une ligne de texte dans le fichier
Extraire le texte d'un PDF - JavaScript
Cet exemple de code montre comment extraire du texte à partir de documents PDF
Input file:
File not added
Output format:
Output file: