以 JavaScript 从 PDF 中提取文本

如何使用 Node.js via C++ 库从 PDF 中提取文本

如何使用 Node.js via C++ 库从 PDF 中提取文本

你需要从 PDF 中提取文本吗?Aspose.PDF for Node.js via C++ 可以帮助从 PDF 文档中提取文本。为了解析 PDF,我们将使用 Aspose.PDF for Node.js via C++ 是一个用于处理 PDF 的简单而安全的工具包。要通过 C++ 安装和使用 Aspose.PDF for Node.js,请从 ZIP 存档 中提取文件。

以 JavaScript 从 PDF 中提取文本


你需要 Aspose.PDF for Node.js via C++ 才能在你的环境中试用代码。

1.在 PDF 中加载 “文档” 实例。 1.创建 textabSorber 对象来提取文本。 1.接受所有页面的吸收器。 1.获取提取的文本 1.创建一个写入器并打开文件,在文件中写一行文本

从 PDF 中提取文本-JavaScript

此示例代码显示如何从 PDF 文档中提取文本

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

关于 Aspose.PDF for Node.js via C++ API

Aspose.PDF for Node.js via C++ 允许开发人员操作它们的 PDF 文件。这个 JavaScript 解决方案建立在 WebAssembly 技术的基础上,基于 C++ 版 Aspose.PDF。你可以通过 C++ 轻松使用 Aspose.Pdf for Node.js,然后按照安装说明进行操作。Aspose.PDF for Node.js 支持多种功能,例如:

  • 优化 PDF 文档。
  • 向 PDF 文件添加图章。
  • 合并 PDF 文件。
  • 将 PDF 拆分为两个文件。
  • 将 PDF 转换为 DOCX、XLSX、JPEG、PNG、TIFF、BMP、SVG、SVG、SVG (ZIP)、XPS、TXT 等

你可以在我们关于如何使用 API 的 文档 中通过 C++ API 找到有关 Node.js 版 Aspose.PDF 的更多信息。