Extraer texto de un PDF en JavaScript

Cómo extraer texto de un PDF con la biblioteca Node.js via C++

Cómo extraer texto de un PDF con la biblioteca Node.js via C++

¿Necesitas extraer texto de un PDF? El archivo Aspose.PDF para Node.js a través de C++ ayuda a extraer texto de un documento PDF. Para analizar PDF, utilizaremos Aspose.PDF para Node.js a través de C++, un conjunto de herramientas fácil y seguro que se utiliza para trabajar con PDF. Para instalar y usar Aspose.PDF para Node.js a través de C++, extraiga los archivos del archivo ZIP.

Extraer texto de un PDF en JavaScript


Necesita Aspose.PDF para Node.js a través de C++ para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Crea un objeto TextAbsorber para extraer texto.
  3. Acepta el absorbente para todas las páginas.
  4. Obtenga el texto extraído
  5. Crea un escritor y abre el archivo, escribe una línea de texto en el archivo

Extraer texto de un PDF - JavaScript

Este código de ejemplo muestra cómo extraer texto de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Acerca de Aspose.PDF para la API Node.js via C++

Aspose.PDF para Node.js a través de C++ permite a los desarrolladores manipular los archivos PDF. Esta solución de JavaScript se basa en el uso de la tecnología WebAssembly y se basa en Aspose.PDF para C++. Puede utilizar fácilmente Aspose.Pdf para Node.js a través de C++ desde y, a continuación, seguir las instrucciones de instalación. El Aspose.PDF para Node.js admite una amplia variedad de funciones, tales como:

  • Optimizar el documento PDF.
  • Añadir un sello al archivo PDF.
  • Combinar archivos PDF.
  • Divide el PDF en dos archivos.
  • Convierte PDF a DOCX, XLSX, JPEG, PNG, TIFF, BMP, SVG, SVG (ZIP), XPS, TXT, etc.

Puedes encontrar más información sobre Aspose.PDF para Node.js mediante la API de C++ en nuestra documentación sobre cómo usar la API.