Extraia texto do PDF em JavaScript

Como extrair texto de um PDF usando a biblioteca Node.js via C++

Como extrair texto de um PDF usando a biblioteca Node.js via C++

Para extrair o arquivo PDF de texto, usaremos a API Aspose.PDF for .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma nodejs-cpp. Abra o gerenciador de pacotes NuGet, pesquise Aspose.pdf e instale. Você também pode usar o seguinte comando no console do Gerenciador de Pacotes.

Extraia texto do PDF em JavaScript


Você precisa da biblioteca Aspose.PDF para testar o código em seu ambiente.

  1. Carregue o PDF com uma instância do Document.
  2. Crie o objeto TextAbsorber para extrair texto.
  3. Aceite o absorvedor para todas as páginas.
  4. Obtenha o texto extraído
  5. Crie um escritor e abra o arquivo, escreva uma linha de texto no arquivo

Extraia texto do PDF - JavaScript

Este código de exemplo mostra como extrair texto de documentos PDF

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Sobre o Aspose.PDF para a API Node.js via C++

Nossa biblioteca.NET pode combinar um documento de qualquer formato de download compatível com qualquer formato de salvamento compatível. A biblioteca Aspose.PDF for .NET fornece soluções bastante universais que ajudarão você a resolver as tarefas de mesclar documentos. O Aspose.PDF suporta o maior número de formatos de documentos populares, tanto para carregar quanto para salvar. Chame a atenção para o fato de que a seção atual descreve apenas mesclagens populares. A página atual fornece informações sobre a mesclagem de TEXT com {{FILERESULT}}. No entanto, existem muitas combinações para mesclar seus arquivos. Para obter uma lista completa dos formatos suportados, consulte a seção Formatos de arquivo suportados.