Extraer texto de un PDF en JavaScript
Cómo extraer texto de un PDF con la biblioteca Node.js via C++
Cómo extraer texto de un PDF con la biblioteca Node.js via C++
Para extraer un archivo PDF de texto, utilizaremos la API Aspose.PDF para.NET, que es una API de manipulación de documentos potente, fácil de usar y rica en funciones para la plataforma nodejs-cpp. Abre el administrador de paquetes NuGet, busca Aspose.pdf e instálalo. También puede usar el siguiente comando desde la consola del administrador de paquetes.
Extraer texto de un PDF en JavaScript
Necesita biblioteca Aspose.PDF para probar el código en su entorno.
- Cargue el PDF con una instancia de Document.
- Crea un objeto TextAbsorber para extraer texto.
- Acepta el absorbente para todas las páginas.
- Obtenga el texto extraído
- Crea un escritor y abre el archivo, escribe una línea de texto en el archivo
Extraer texto de un PDF - JavaScript
Este código de ejemplo muestra cómo extraer texto de documentos PDF
Input file:
File not added
Output format:
Output file: