为什么选择 Aspose.OCR for Node.js via C++?

Aspose.OCR for Node.js via C++ 允许您在安装 Node.js 的任何平台上从扫描的页面、照片、屏幕截图和其他图像中提取文本。为您的本地产品、Web 服务、无服务器应用程序、AWS Lambda、Azure Functions 和其他代码提供光学字符识别功能。

我们强大且功能丰富的光学字符识别 (OCR) API 支持 130 多种基于拉丁语、西里尔语和亚洲文字的语言,包括中文和印地语,并且可以识别最流行格式的文件。

Illustration ocr

高效准确的OCR

通过 C++ 技术,利用先进的 Node.js 实现高速、准确的 OCR 结果。

多语言支持

识别 130 多种语言的文本,包括拉丁语、西里尔语、阿拉伯语、波斯语、印度语和中文脚本,通过 C++ 集成确保 Node.js 应用程序的多功能性。

多功能图像支持

通过 C++ 使用 Node.js 轻松处理来自扫描仪、相机和智能手机的图像。

汉字识别精度

通过 C++ 在 Node.js 项目中精确识别 6,000 多个汉字。

布局检测

识别图像中的内容块并对其进行分类,以确保提取的文本的顺序正确,无论布局如何。

实时代码示例

使用几行代码从图像中启动文本识别。体验简单!

准备好识别 准备好识别 将文件拖放到此处或单击浏览*

* 通过上传您的文件或使用我们的服务,您同意我们的 使用条款隐私政策.

识别结果
 

将图像转换为文本

更多示例 >
fs.readFile("source.png", (err, imageData) => {
  // Save photo to the virtual storage
  const imageBytes = new Uint8Array(imageData);
  let internalFileName = "temp";
  let stream = Module.FS.open(internalFileName, "w+");
  Module.FS.write(stream, imageBytes, 0, imageBytes.length, 0);
  Module.FS.close(stream);

  // Add photo to recognition batch
  let source = Module.WasmAsposeOCRInput();
  source.url = internalFileName;
  let batch = new Module.WasmAsposeOCRInputs();
  batch.push_back(source);

  // Automatically adjust recognition settings to better process photographs
  let recognitionSettings = Module.WasmAsposeOCRRecognitionSettings();
  recognitionSettings.detect_areas_mode = Module.DetectAreasMode.PHOTO;
  recognitionSettings.auto_contrast= true;

  // Send photo for OCR
  var result = Module.AsposeOCRRecognize(batch, recognitionSettings);
  // Output extracted text to the console
  var text = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
  console.log(text);
});

集成到 Node.js 应用程序

Aspose.OCR for Node.js 与任何支持 C++ 的平台无缝集成 - 无论是桌面 Windows、Windows Server、macOS、Linux ,或云。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for Node.js via C++ 几乎可以处理任何 文件 您可以通过扫描仪或相机获取。识别结果以最流行的文件和数据交换格式返回,可以保存、导入数据库或实时分析。

图片

  • JPEG
  • PNG
  • TIFF
  • BMP

批量OCR

  • ZIP

识别结果

  • Text
  • JSON
  • XML

体验性能和质量

尖端的 OCR 技术可确保快速、准确地识别图像中的文本,为您的应用程序提供一流的功能。利用我们的高性能 OCR 解决方案提高您的项目效率和用户体验。

130+ 识别语言

Node.js OCR API 可识别多种语言和流行的书写脚本,包括混合语言:

将语言检测留给库或您自己定义语言,以增强识别性能和可靠性。

  • 扩展拉丁字母表:英语、西班牙语、法语、印度尼西亚语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种;
  • 西里尔文字母:俄语、乌克兰语、哈萨克语、塞尔维亚语、白俄罗斯语、保加利亚语;
  • 阿拉伯语、波斯语、乌尔都语;
  • 中文和梵文文字,包括印地语、马拉地语、博杰普尔语等。

适合任何内容

文本识别的准确性和可靠性很大程度上取决于原始图像的质量。 Aspose.OCR for Node.js via C++ 提供了广泛的全自动和手动图像处理过滤器,可在将图像发送到 OCR 引擎之前对其进行增强。

特性和功能

Aspose.OCR for Node.js via C++ 探索 Aspose.OCR for Node.js 的高级功能。

Feature icon

照片识别

以扫描级精度从智能手机照片中提取文本。

Feature icon

可搜索的 PDF

将任何扫描结果转换为完全可搜索和可索引的文档。

Feature icon

网址识别

从 URL 识别图像,无需下载到本地。

Feature icon

批量识别

读取多页文档、文件夹和档案中的所有图像。

Feature icon

任何字体和样式

识别并识别所有流行字体和样式的文本。

Feature icon

微调识别

调整每个 OCR 参数以获得最佳识别结果。

Node.js OCR 代码示例

发现代码示例以轻松将 OCR 集成到您的 Node.js 应用程序中。

安装中

Aspose.OCR for Node.js 作为 NPM 包或独立的 可下载文件 提供,没有外部依赖项。轻松将其安装到您的项目中,您就可以识别多种受支持语言的文本并获得各种格式的识别结果。

在代码中导入 Node.js 模块的 OCR。

const Module = require("aspose-ocr/lib/asposeocr");

使用 Node.js 进行图像到文本识别

Node.js OCR 允许将表格图像转换为可编辑文本,从而简化数据提取。我们强大的 OCR 解决方案非常适合各种业务案例,增强了数据可访问性,提高了应用程序的生产力。

设置表格图像到文本的转换 - Node.js

// Load a scan or photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;

// Analyze tabular structures
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.TABLE;

// Limit the subset of characters to improve recognition accuracy and increase performance
settings.alphabet = "1234567890.,;";

// Extract text from a table
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);