在 Node.js 中将图像转换为文本
Node.js 中的图像到文本
更多展示 >let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
为什么选择 Aspose.OCR for Node.js via C++?
Aspose.OCR for Node.js via C++ 允许您在安装 Node.js 的任何平台上从扫描的页面、照片、屏幕截图和其他图像中提取文本。为您的本地产品、Web 服务、无服务器应用程序、AWS Lambda、Azure Functions 和其他代码提供光学字符识别功能。
我们强大且功能丰富的光学字符识别 (OCR) API 支持 130 多种基于拉丁语、西里尔语和亚洲文字的语言,包括中文和印地语,并且可以识别最流行格式的文件。
高效准确的OCR
通过 C++ 技术,利用先进的 Node.js 实现高速、准确的 OCR 结果。
多语言支持
识别 130 多种语言的文本,包括拉丁语、西里尔语、阿拉伯语、波斯语、印度语和中文脚本,通过 C++ 集成确保 Node.js 应用程序的多功能性。
多功能图像支持
通过 C++ 使用 Node.js 轻松处理来自扫描仪、相机和智能手机的图像。
汉字识别精度
通过 C++ 在 Node.js 项目中精确识别 6,000 多个汉字。
布局检测
识别图像中的内容块并对其进行分类,以确保提取的文本的顺序正确,无论布局如何。
实时代码示例
使用几行代码从图像中启动文本识别。体验简单!
将图像转换为文本
更多示例 >fs.readFile("source.png", (err, imageData) => {
// Save photo to the virtual storage
const imageBytes = new Uint8Array(imageData);
let internalFileName = "temp";
let stream = Module.FS.open(internalFileName, "w+");
Module.FS.write(stream, imageBytes, 0, imageBytes.length, 0);
Module.FS.close(stream);
// Add photo to recognition batch
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Automatically adjust recognition settings to better process photographs
let recognitionSettings = Module.WasmAsposeOCRRecognitionSettings();
recognitionSettings.detect_areas_mode = Module.DetectAreasMode.PHOTO;
recognitionSettings.auto_contrast= true;
// Send photo for OCR
var result = Module.AsposeOCRRecognize(batch, recognitionSettings);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(text);
});
集成到 Node.js 应用程序
Aspose.OCR for Node.js 与任何支持 C++ 的平台无缝集成 - 无论是桌面 Windows、Windows Server、macOS、Linux ,或云。
支持的文件格式
Aspose.OCR for Node.js via C++ 几乎可以处理任何 文件 您可以通过扫描仪或相机获取。识别结果以最流行的文件和数据交换格式返回,可以保存、导入数据库或实时分析。
图片
- JPEG
- PNG
- TIFF
- BMP
批量OCR
- ZIP
识别结果
- Text
- JSON
- XML
体验性能和质量
尖端的 OCR 技术可确保快速、准确地识别图像中的文本,为您的应用程序提供一流的功能。利用我们的高性能 OCR 解决方案提高您的项目效率和用户体验。
130+ 识别语言
Node.js OCR API 可识别多种语言和流行的书写脚本,包括混合语言:
将语言检测留给库或您自己定义语言,以增强识别性能和可靠性。
- 扩展拉丁字母表:英语、西班牙语、法语、印度尼西亚语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种;
- 西里尔文字母:俄语、乌克兰语、哈萨克语、塞尔维亚语、白俄罗斯语、保加利亚语;
- 阿拉伯语、波斯语、乌尔都语;
- 中文和梵文文字,包括印地语、马拉地语、博杰普尔语等。
适合任何内容
文本识别的准确性和可靠性很大程度上取决于原始图像的质量。 Aspose.OCR for Node.js via C++ 提供了广泛的全自动和手动图像处理过滤器,可在将图像发送到 OCR 引擎之前对其进行增强。
特性和功能
Aspose.OCR for Node.js via C++ 探索 Aspose.OCR for Node.js 的高级功能。
照片识别
以扫描级精度从智能手机照片中提取文本。
可搜索的 PDF
将任何扫描结果转换为完全可搜索和可索引的文档。
网址识别
从 URL 识别图像,无需下载到本地。
批量识别
读取多页文档、文件夹和档案中的所有图像。
任何字体和样式
识别并识别所有流行字体和样式的文本。
微调识别
调整每个 OCR 参数以获得最佳识别结果。
Node.js OCR 代码示例
发现代码示例以轻松将 OCR 集成到您的 Node.js 应用程序中。
安装中
Aspose.OCR for Node.js 作为 NPM 包或独立的 可下载文件 提供,没有外部依赖项。轻松将其安装到您的项目中,您就可以识别多种受支持语言的文本并获得各种格式的识别结果。
在代码中导入 Node.js 模块的 OCR。
const Module = require("aspose-ocr/lib/asposeocr");
使用 Node.js 进行图像到文本识别
Node.js OCR 允许将表格图像转换为可编辑文本,从而简化数据提取。我们强大的 OCR 解决方案非常适合各种业务案例,增强了数据可访问性,提高了应用程序的生产力。
设置表格图像到文本的转换 - Node.js
// Load a scan or photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Analyze tabular structures
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.TABLE;
// Limit the subset of characters to improve recognition accuracy and increase performance
settings.alphabet = "1234567890.,;";
// Extract text from a table
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);