Extraer texto de un PDF en JavaScript

Cómo extraer texto de un PDF con la biblioteca Node.js via C++

Cómo extraer texto de un PDF con la biblioteca Node.js via C++

Para extraer un archivo PDF de texto, utilizaremos la API Aspose.PDF para.NET, que es una API de manipulación de documentos potente, fácil de usar y rica en funciones para la plataforma nodejs-cpp. Abre el administrador de paquetes NuGet, busca Aspose.pdf e instálalo. También puede usar el siguiente comando desde la consola del administrador de paquetes.

Extraer texto de un PDF en JavaScript


Necesita biblioteca Aspose.PDF para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Crea un objeto TextAbsorber para extraer texto.
  3. Acepta el absorbente para todas las páginas.
  4. Obtenga el texto extraído
  5. Crea un escritor y abre el archivo, escribe una línea de texto en el archivo

Extraer texto de un PDF - JavaScript

Este código de ejemplo muestra cómo extraer texto de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Acerca de Aspose.PDF para la API Node.js via C++

Nuestra biblioteca.NET puede combinar un documento de cualquier formato de descarga compatible con cualquier formato de guardado compatible. Aspose.PDF para la biblioteca.NET ofrece soluciones bastante universales que le ayudarán a resolver las tareas de fusión de documentos. Aspose.PDF admite la mayor cantidad de formatos de documentos populares, tanto para cargar como para guardar. Tenga en cuenta que la sección actual solo describe las combinaciones populares. La página actual proporciona información sobre cómo combinar TEXT con {{FILERESULT}}. Sin embargo, hay muchas combinaciones para fusionar los archivos. Para obtener una lista completa de los formatos compatibles, consulte la sección Formatos de archivo compatibles.