以 JavaScript 从 PDF 中提取文本

如何使用 javascript-cpp 从 PDF 中提取文本

如何使用 Aspose.PDF for JavaScript via C++ 从 PDF 中提取文本

您需要從 PDF 文件中提取文字嗎? Aspose.PDF for JavaScript via C++ 可以幫助您從 PDF 文件中提取文字。為了提取文本,我們將使用 Aspose.PDF for JavaScript via C++,這是一個簡單安全的工具包,可以直接在 Web 瀏覽器中處理 PDF 文件。若要安裝和使用 Aspose.PDF for JavaScript via C++,請從 ZIP 壓縮套件 擷取檔案。

以 JavaScript 从 PDF 中提取文本


你需要 Aspose.PDF for JavaScript 通过 C++ 才能在你的环境中试用代码。

  1. 在 PDF 中加载 “文档” 实例。
  2. 创建 textabSorber 对象来提取文本。
  3. 接受所有页面的吸收器。
  4. 获取提取的文本
  5. 创建一个写入器并打开文件,在文件中写一行文本

使用 JavaScript 从 PDF 中提取文本

此示例代码显示如何从 PDF 文档中提取文本

Input file:

File not added

Output format:

PDF

Output file:


    var ffileExtract = function (e) {
        const file_reader = new FileReader();
        file_reader.onload = (event) => {
        /*Extract text from a PDF-file*/
        const json = AsposePdfExtractText(event.target.result, e.target.files[0].name);
        if (json.errorCode == 0) document.getElementById('output').textContent = json.extractText;
        else document.getElementById('output').textContent = json.errorText;
        };
        file_reader.readAsArrayBuffer(e.target.files[0]);
    };

關於 Aspose.PDF for JavaScript via C++ API

通过 C++ 的 JavaScript 的 Aspose.PDF 允许开发人员直接在网络中操作它们 PDF 文件。这个 JavaScript 解决方案建立在 WebAssembly 技术的基础上,基于适用于.NET 轻量级的 Aspose.PDF。你可以通过 C++ 轻松使用适用于 JavaScript 的 aspose-pdf,然后按照安装说明进行操作。适用于 JavaScript 的 Aspose.PDF 支持多种功能,例如:

  • 优化 PDF 文档。
  • 在 PDF 文件中添加图章。
  • 合并 PDF 文件。
  • 将 PDF 拆分为两个文件。
  • 将 PDF 转换为 DOCX、XLSX、JPEG、PNG、TIFF、BMP、SVG、SVG (ZIP)、XPS、TXT 等

你可以在我们的 文档 上通过 C++ API 找到更多关于 JavaScript 版 Aspose.PDF 的信息,了解如何使用 API。