将 OCR 添加到您的网页 - JavaScript - Electron
您网站上的 OCR
更多展示 >var input = Module.WasmAsposeOCRInput();
var inputs = new Module.WasmAsposeOCRInputs();
// Prepare settings
var settings = Module.WasmAsposeOCRRecognitionSettings();
input.url = "<file name>";
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Serrialize result
var result_str = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(result_str);
为什么选择 Aspose.OCR for JavaScript via C++?
Aspose.OCR for JavaScript via C++ 允许您直接在网页上或从跨平台 Electron 应用程序中从扫描的页面、照片、屏幕截图和其他图像中提取文本。它基于 WebAssembly (Wasm) 技术,允许代码在最终用户的设备上运行,而不需要 Web 服务器。它可以原生集成到您的 JavaScript 上下文中,包括访问所有 Web 浏览器功能。 Aspose.OCR for JavaScript via C++ 在嵌入网络时提供最高的安全性,并将强制执行浏览器的同源和权限安全策略。
我们强大且功能丰富的光学字符识别 (OCR) API 支持基于拉丁语、西里尔语和亚洲文字的 130 多种语言,包括中文和印地语,并且可以识别最流行格式的文件。各种处理过滤器允许您识别倾斜、扭曲和噪声的图像。识别结果以最流行的数据交换格式返回。
快速准确的 OCR
通过 C++ 技术使用先进的 JavaScript 实现高速、准确的 OCR 结果。
多语言支持
识别 130 多种语言的文本,包括拉丁语、西里尔语、阿拉伯语、波斯语、印度语和中文脚本,通过 C++ 集成确保 JavaScript 应用程序的多功能性。
多功能图像支持
通过 C++ 使用 JavaScript 轻松处理来自扫描仪、相机和智能手机的图像。
汉字识别精度
通过 C++ 在 JavaScript 项目中精确识别 6,000 多个汉字。
布局检测
识别图像中的内容块并对其进行分类,以确保提取的文本的顺序正确,无论布局如何。
实时代码示例
只需三行代码即可启动图像文本识别。体验简单!
将图像转换为文本
更多示例 >const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
var inputs = new Module.WasmAsposeOCRInputs();
var settings = Module.WasmAsposeOCRRecognitionSettings();
input.url = filename;
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Get recognition results as text
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);
OCR 集成到您的 WEB 应用程序中
Aspose.OCR for JavaScript 允许代码直接在最终用户的 Web 浏览器(客户端)或基于浏览器的环境(例如 Electon)中运行。
支持的文件格式
Aspose.OCR for Javascript via C++ 几乎可以处理任何 文件 您可以通过扫描仪或相机获取。识别结果以最流行的文件和数据交换格式返回,可以保存、导入数据库或实时分析。
图片
- JPEG
- PNG
- TIFF
- BMP
批量OCR
- ZIP
识别结果
- Text
- JSON
- XML
轻松安装
Aspose.OCR for JavaScript via C++ 作为独立的可下载包分发,不需要安装任何外部依赖项。只需将其解压到 HTML 页面旁边,您就可以在浏览器中将任何图像转换为文本。
请求试用许可证 以无限制地开始开发功能齐全的 OCR 应用程序。
130+ 识别语言
JavaScript OCR API 可识别 130 多种语言和流行的书写脚本,包括混合语言:
将语言检测留给库或您自己定义语言,以增强识别性能和可靠性。
- 扩展拉丁字母表:英语、西班牙语、法语、印度尼西亚语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种;
- 西里尔文字母:俄语、乌克兰语、哈萨克语、塞尔维亚语、白俄罗斯语、保加利亚语;
- 阿拉伯语、波斯语、乌尔都语;
- 中文和梵文文字,包括印地语、马拉地语、博杰普尔语等。
适合任何内容
JavaScript OCR API 可识别 130 多种语言和流行的书写脚本,包括混合语言:
将语言检测留给库或您自己定义语言,以增强识别性能和可靠性。
主要特征
Aspose.OCR for Javascript via C++ 探索 Aspose.OCR for JavaScript 的高级功能。
照片识别
以扫描级精度从智能手机照片中提取文本。
可搜索的 PDF
将任何扫描结果转换为完全可搜索和可索引的文档。
网址识别
从 URL 识别图像,无需下载到本地。
批量识别
读取多页文档、文件夹和档案中的所有图像。
任何字体和样式
识别并识别所有流行字体和样式的文本。
微调识别
调整每个 OCR 参数以获得最佳识别结果。
JavaScript 代码示例
发现代码示例,通过 C++ 将 Aspose.OCR for JavaScript 无缝集成到您的 HTML 页面和 Electron 应用程序中。
JavaScript 的简单安装
使用 JavaScript 进行图像识别
OCR 应用程序的广泛采用通常会因为扫描仪对于大多数用户而言并不常见而受到阻碍。我们的 OCR 库具有强大的内置图像预处理过滤器,可以处理黑暗、旋转、倾斜和噪声图像。结合对所有图像格式的支持,它甚至可以可靠地识别智能手机照片。大多数预处理和图像校正都是自动完成的,因此您只需在困难的情况下进行干预。
应用自动图像校正 - JavaScript
// Load photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Automatically adjust contrast and remove noise
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.PHOTO;
settings.auto_contrast = true;
settings.auto_denoising = true;
// Extract text from photo:
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Output recognition results
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);
JavaScript 通用图像到文本转换器
尽管许多企业、组织和个人一直在积极努力减少对纸质文档的依赖,但这仍然是最广泛的存储和共享格式。由物理档案支持的扫描文档足以满足法规遵从性、法律目的、长期备份和冗余。然而,基于现有扫描内容或现有文档的一部分创建新内容的业务案例经常出现。 Aspose.OCR for JavaScript via С++ 可以轻松将扫描的页面转换为可搜索和可编辑的文本。内容识别的准确性和速度都很高,可以节省您手动输入的时间和精力,并确保没有人为错误,尤其是在处理大量信息时。
将图像转换为文档 - JavaScript
// Load a scanned page from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Analyze content structure
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.DOCUMENT;
settings.upscale_small_font = true;
// Extract text from a page
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
从表中提取数值数据
当管理包含数字数据的大型打印表格时,例如现场社会学调查的原始数据或库存清单,手动提取变得缓慢、不切实际的过程,极易出现人为错误。 OCR 有助于自动化和标准化信息提取,确保结果一致且可靠。 Aspose.OCR for JavaScript via С++ 完全自动将扫描或拍摄的表格数据转换为机器可读的内容。提取的数据可以轻松集成到数据库中并进行分析,有助于做出更明智的决策。
表格图像到文本 - JavaScript
// Load a scan or photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Analyze tabular structures
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.TABLE;
// Limit the subset of characters to improve recognition accuracy and increase performance
settings.alphabet = "1234567890.,;";
// Extract text from a table
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);