适用于 C#、Java、Python 等的 OCR 库
体验最可靠且对开发人员友好的 OCR API 之一。只需用您喜欢的编程语言编写几行代码,即可从图像中提取机器可读的文本,并将扫描的 PDF 转换为可搜索、可编辑的文档。
Aspose OCR 库支持 130 多种全球语言,包括扩展拉丁语、西里尔语、中文、韩语、日语、印地语、阿拉伯语、波斯语、泰米尔语等。我们的 API 可以轻松处理具有混合语言支持的多语言文本。
主要特点
以无与伦比的准确性从任何文件中提取机器可读的文本。阅读任何语言,包括多语言文本。
阅读所有内容
将扫描件、照片和屏幕截图转换为文本;创建可搜索的 PDF;从 URL 读取图像。
可靠的结果
即使是旋转、模糊、扭曲和有噪声的图像,也能实现最高的识别精度。
批量处理
批量识别文件夹和档案中的所有图像,并读取多页 PDF 文档和 TIFF 图像。
布局检测
处理任何布局:多列文档、表格、街道照片、身份证、车牌等。
便于使用
Aspose OCR API 可自动执行图像分析、语言检测、预处理和后处理,让您专注于业务任务,而无需担心被技术细节分散注意力。
将图像转换为文本
/** Initialize recognition API */
AsposeOcr api = new AsposeOcr();
/** Provide the image for recognition */
OcrInput source = new OcrInput(InputType.SingleImage);
source.Add("image.png");
/** Recognize and output results */
List<RecognitionResult> results = api.Recognize(source);
Console.WriteLine(results[0].RecognitionText);
140+识别语言
英语、法语、西班牙语、西里尔语、阿拉伯语、波斯语、中文、印地语、日语、韩语、泰米尔语等等。识别混合语言,例如中文/英文、阿拉伯文/英文或西里尔文/英文。
为什么选择 Aspose.OCR?
- 130+
语言
Aspose 为全球范围内的内容数字化提供通用 OCR 解决方案。它支持大多数欧洲、亚洲、非洲和美洲语言,非常适合多语言项目。
- 9+
发展年数
我们的 OCR 模型经过多年的开发和测试。这意味着卓越的可靠性,即使在其他 OCR 库可能难以实现足够速度和准确性的复杂情况下也是如此。
- 2.0M+
下载
我们的库受到开发人员的广泛采用和信任,已成为 OCR 相关项目的首选。凭借强大的功能和可靠的支持,它使您能够充满信心地进行构建。
在线尝试
即使对于刚接触该技术的开发人员来说,光学字符识别也成为 Aspose OCR 的一项简单而简单的任务。看看这是多么容易!
在线 OCR 应用程序
阅读一切
文本识别的准确性在很大程度上依赖于原始图像的质量。 Aspose OCR 提供了一套全面的图像处理过滤器,包括全自动和手动,以在 OCR 处理之前提高图像质量。
我们强大的图像处理和可定制的内容结构检测算法使您可以从几乎任何图像中提取文本,从高质量扫描到模糊的街头照片。为了获得最佳识别结果,您可以对同一图像应用多个处理过滤器。
可扩展到任何任务
根据您的需求微调识别过程。选择高精度彻底识别或优先考虑速度的快速识别。根据您的处理器核心利用库的自动扩展功能,或手动指定线程数以获得最佳性能。通过将计算卸载到 GPU 来释放宝贵的 CPU 资源。
通过有选择地添加我们的 在线存储库 中的高级功能,保持您的应用程序精简和模块化。例如,如果您只需要阿拉伯字符识别,则可以省略中文、日文、韩文、印地文、西里尔文等 OCR 模型,从而节省大量磁盘空间。
解决方案
Aspose OCR 库适用于从个人到企业和政府级别的任何任务。无论规模大小,我们都会以最高效率处理技术实施。
企业
中小企业
个人的
先进的 OCR 引擎
大多数 OCR 库都基于开源解决方案,仅在处理基本扫描文档时表现良好。然而,此类解决方案通常难以处理颠倒和倒置的图像、多列布局和表格、街道照片以及复杂的布局。如果您的项目要求关键数据提取具有极高的准确性,您应该考虑替代方案。
Aspose OCR 由我们的机器学习专家多年来开发和完善,建立在经过广泛数据集训练的专有引擎之上。通过客户反馈不断改进,不仅匹配 Tesseract 的能力,而且在复杂场景下的表现也优于 Tesseract。当 Tesseract 遇到困难时,Aspose OCR 可以提供卓越的准确性,即使在最具挑战性的情况下也能确保可靠的文本识别。
通过提供广泛的支持选项,我们确保为您降低维护成本,尤其是从长远来看。
控制识别的各个方面
我们的 OCR 库提供出色的开箱即用识别精度和性能。然而,在某些情况下,默认设置可能无法提供最可靠的识别结果,从而提供了进一步优化的潜力。
我们 API 的真正强大之处在于它的灵活性和对每个识别步骤的精细控制。微调设置并创建自定义图像预处理工作流程,以实现速度和准确性之间的完美平衡,以满足您的特定需求。
Aspose.OCR 低代码 API
使用我们基于云的 OCR 服务,在任何设备上从图像中提取文本并将扫描件转换为可搜索的 PDF。
Aspose.OCR 云 REST API
无需安装任何软件即可进行光学字符识别。只需使用 cURL 命令并将它们组合到脚本中即可完成复杂的自动化任务。
Aspose.OCR Cloud for .NET
从您的 C# 代码轻松与 Aspose.OCR Cloud REST API 进行通信。该 SDK 将所有日常任务包装为简单的方法,消除了技术复杂性。
Aspose.OCR Cloud for Java
创建专注于业务任务的跨平台 Java OCR 应用程序。 SDK 处理连接设置、发送 API 请求和解析响应。
Aspose.OCR 无代码应用程序
立即从图像、扫描的 PDF、照片、屏幕截图或收据中提取文本,并通过网络浏览器将扫描件转换为可搜索的 PDF。