Aspose.OCR for Python via .NET 是一款功能强大且易于使用的光学字符识别 (OCR) 引擎,适用于您的 Python 应用程序和笔记本。只需不到 10 行代码,您就可以识别基于拉丁文、西里尔文和亚洲文字的 28 种语言的文本,并以最流行的文档和数据交换格式返回结果。无需学习复杂的数学模型、构建机器学习算法和训练神经网络 — 我们简单而强大的 API 将为您做一切。
该库适用于所有来源,从高质量扫描到智能手机上的快速照片。图像是否旋转、扭曲或有噪声 — 自动预处理和后处理过滤器可在最短的时间内提供最高的识别精度。
特性和功能
从扫描件、照片和屏幕截图中提取文本
将扫描的 PDF 转换为可搜索和可索引的 PDF
阅读所有流行字体的拉丁文、西里尔文和亚洲文字
认识6000多个汉字
处理模糊、扭曲、旋转和有噪声的图像
识别并保留原始文本布局中的内容块
检测并读取图像的区域:段落、线条和单个单词
批量处理多页文档、文件夹和档案
识别来自互联网的图像,无需下载
识别并自动纠正拼写错误的单词
查找图像中的文本并智能比较图像文本
便于使用
您只需要 5 行代码即可识别图像并显示结果。是的,确实就是这么简单!
* 通过上传您的文件或使用我们的服务,您同意我们的 使用条款和 隐私政策.
实时代码示例 - Python 3
# 初始化 OCR 引擎
recognitionEngine = AsposeOcr()
# 将图像添加到批次
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# 从图像中提取文本
result = recognitionEngine.recognize(input)
# 显示识别结果
print(result[0].recognition_text)
28种识别语言
Aspose.OCR for Python via .NET 可以识别大量语言和所有流行的书写文字,包括混合语言的文本:
- 扩展拉丁字母:克罗地亚语、捷克语、丹麦语、荷兰语、英语(包括手写体)、爱沙尼亚语、芬兰语、法语、德语、意大利语、拉脱维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、西班牙语,瑞典语。
- 西里尔字母:白俄罗斯语、保加利亚语、哈萨克语、俄语、塞尔维亚语、乌克兰语。
- 中文:超过 6,000 个字符。
- 印地语
您还可以阅读基于扩展拉丁语和西里尔语的其他语言的文本,即使 OCR 引擎不直接支持它们。例如拉丁语、越南语、盖尔语等。
强大的处理过滤器
光学字符识别的准确性和可靠性很大程度上取决于原始图像的质量。 Aspose.OCR for Python via .NET 提供大量全自动和手动图像处理过滤器,可在将图像发送到 OCR 引擎之前对其进行增强:
- 自动拉直与水平方向成微小角度的图像。
- 手动旋转严重倾斜的图像。
- 自动去除污垢、斑点、划痕、眩光、不需要的渐变和其他噪音。
- 自动调整图像对比度。
- 自动放大图像或手动调整图像大小。
- 将图像转换为黑白或灰度图像。
- 反转图像颜色,使亮区显得较暗,暗区显得较亮。
- 增加图像中字符的粗细。
- 模糊嘈杂的图像,同时保留字母的边缘。
- 拉直页面曲率并修复页面照片的相机镜头畸变。
这些滤镜可以组合并应用于整个图像或仅应用于图像的选定区域,以及批处理。您不仅可以在识别管道中微调预处理,还可以存储处理后的图像以供显示、缓存和调试。
针对特定文档类型进行了优化
Aspose.OCR for Python via .NET 提供经过专门训练的神经网络,以最高精度从某些类型的图像中提取文本:
- 身份证和护照的扫描件或照片。
- 车辆牌照。
- 发票。
- 收据。
内置拼写检查器
虽然 Aspose.OCR for Python via .NET 识别精度高,印刷缺陷、污垢或不标准字体可能会导致某些字符或文字无法正确识别。为了进一步提高识别结果,您可以打开拼写检查器,它会根据所选的识别语言查找并自动纠正拼写错误。
如果识别的文本包含专业术语、缩写词以及其他常见拼写词典中没有的单词,您可以提供自己的单词列表。
创建可搜索的 PDF
即使具有最高的识别精度,原始图像也可能包含大量重要的非文本信息或者仅仅具有巨大的历史价值。 Aspose.OCR for Python via .NET 提供了一个简单而优雅的解决方案,结合了两全其美的优点。我们从图像、PDF 文档或文件包中提取文本,并将其作为不可见的文本层放置在原始图像之上。结果以 PDF 格式保存,这是存储和共享文档的行业标准。可以对生成的文件进行搜索和索引,并且可以选择和复制文本,就像选择和复制原始字符一样。
批量识别
Aspose.OCR for Python via .NET 允许您识别多个文件,无论其数量和类型如何,就像读取单个图像一样简单。通过一次 API 调用,您可以从自动送纸扫描仪中识别多个页面,或从自动交通摄像头中提取车辆牌照。
结果可以保存为可搜索的 PDF 文档或电子表格,或以纯文本、JSON 或 XML 形式返回以供进一步分析。