Extraire du texte d’un PDF en JavaScript

Comment extraire du texte d’un PDF à l’aide de la bibliothèque Node.js via C++

Comment extraire du texte d'un PDF à l'aide de la bibliothèque Node.js via C++

Avez-vous besoin d’extraire du texte d’un PDF ? Le fichier Aspose.PDF pour Node.js via C++ permet d’extraire le texte d’un document PDF. Pour analyser le PDF, nous utiliserons Aspose.PDF pour Node.js via C++, une boîte à outils simple et sécurisée utilisée pour travailler avec le PDF. Pour installer et utiliser Aspose.PDF pour Node.js via C++, extrayez les fichiers de l’ archive ZIP.

Extraire du texte d’un PDF en JavaScript


Vous avez besoin de Aspose.PDF pour Node.js via C++ pour essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un objet TextAbsorber pour extraire du texte.
  3. Acceptez l’absorbeur pour toutes les pages.
  4. Obtenir le texte extrait
  5. Créez un rédacteur et ouvrez le fichier, écrivez une ligne de texte dans le fichier

Extraire le texte d'un PDF - JavaScript

Cet exemple de code montre comment extraire du texte à partir de documents PDF

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

À propos de Aspose.PDF pour l'API Node.js via C++

Aspose.PDF pour Node.js via C++ permet aux développeurs de manipuler des fichiers PDF. Cette solution JavaScript repose sur l’utilisation de la technologie WebAssembly et est basée sur Aspose.PDF pour C++. Vous pouvez facilement utiliser Aspose.Pdf pour Node.js via C++ à partir de, puis suivre les instructions d’installation. Le fichier Aspose.PDF pour Node.js prend en charge une grande variété de fonctions telles que :

  • Optimisez le document PDF.
  • Ajoutez un tampon au fichier PDF.
  • Fusionnez des fichiers PDF.
  • Divisez le PDF en deux fichiers.
  • Convertissez des PDF en DOCX, XLSX, JPEG, PNG, TIFF, BMP, SVG, SVG (ZIP), XPS, TXT, etc.

Vous trouverez plus d’informations sur Aspose.PDF pour Node.js via l’API C++ dans notre documentation sur l’utilisation de l’API.