Python 光学字符识别 API

从扫描图像、照片和屏幕截图中提取文本，创建可搜索的 PDF，搜索和比较图像中的文本，等等。

Aspose.OCR for Python via .NET 是一款功能强大且易于使用的光学字符识别 (OCR) 引擎，适用于您的 Python 应用程序和笔记本。只需不到 10 行代码，您就可以识别基于拉丁文、西里尔文和亚洲文字的 28 种语言的文本，并以最流行的文档和数据交换格式返回结果。无需学习复杂的数学模型、构建机器学习算法和训练神经网络 — 我们简单而强大的 API 将为您做一切。

该库适用于所有来源，从高质量扫描到智能手机上的快速照片。图像是否旋转、扭曲或有噪声 — 自动预处理和后处理过滤器可在最短的时间内提供最高的识别精度。

乍看上去

从任何图像类型中提取主要欧洲和亚洲语言的文本

图像类型

照片
书籍
文章
合同
身份证
护照
收据
发票
车牌
还有更多...

支持的语言

英语
中文
印地语
德语
法语
西班牙语
俄语
意大利语
波兰语
还有更多...

Aspose.OCR

平台独立性

Aspose.OCR for Python via .NET 在 Python 3.6 或更高版本下工作

Desktop OS

Windows 7
Windows 8
Windows 10
Windows 11
Linux

Server OS

Windows Server 2008
Windows Server 2012
Windows Server 2016
Windows Server 2019
Windows Server 2022

Aspose.OCR

支持的文件格式

将来自扫描仪、相机或互联网的任何图像转换为最流行的文档和数据交换格式

源文件

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

识别结果

Searchable PDF
Microsoft Word
Microsoft Excel
EPUB
Plain text
JSON
XML

Aspose.OCR

特性和功能

从扫描件、照片和屏幕截图中提取文本

将扫描的 PDF 转换为可搜索和可索引的 PDF

阅读所有流行字体的拉丁文、西里尔文和亚洲文字

认识6000多个汉字

处理模糊、扭曲、旋转和有噪声的图像

识别并保留原始文本布局中的内容块

检测并读取图像的区域：段落、线条和单个单词

批量处理多页文档、文件夹和档案

识别来自互联网的图像，无需下载

识别并自动纠正拼写错误的单词

查找图像中的文本并智能比较图像文本

便于使用

您只需要 5 行代码即可识别图像并显示结果。是的，确实就是这么简单！

准备好识别认识将文件拖放到此处或单击浏览 *

* 通过上传您的文件或使用我们的服务，您同意我们的使用条款和隐私政策.

实时代码示例 - Python 3

# 初始化 OCR 引擎
recognitionEngine = AsposeOcr()
# 将图像添加到批次
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# 从图像中提取文本
result = recognitionEngine.recognize(input)
# 显示识别结果
print(result[0].recognition_text)

识别结果

28种识别语言

Aspose.OCR for Python via .NET 可以识别大量语言和所有流行的书写文字，包括混合语言的文本：

扩展拉丁字母：克罗地亚语、捷克语、丹麦语、荷兰语、英语（包括手写体）、爱沙尼亚语、芬兰语、法语、德语、意大利语、拉脱维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、西班牙语，瑞典语。
西里尔字母：白俄罗斯语、保加利亚语、哈萨克语、俄语、塞尔维亚语、乌克兰语。
中文：超过 6,000 个字符。
印地语

您还可以阅读基于扩展拉丁语和西里尔语的其他语言的文本，即使 OCR 引擎不直接支持它们。例如拉丁语、越南语、盖尔语等。

强大的处理过滤器

光学字符识别的准确性和可靠性很大程度上取决于原始图像的质量。 Aspose.OCR for Python via .NET 提供大量全自动和手动图像处理过滤器，可在将图像发送到 OCR 引擎之前对其进行增强：

自动拉直与水平方向成微小角度的图像。
手动旋转严重倾斜的图像。
自动去除污垢、斑点、划痕、眩光、不需要的渐变和其他噪音。
自动调整图像对比度。
自动放大图像或手动调整图像大小。
将图像转换为黑白或灰度图像。
反转图像颜色，使亮区显得较暗，暗区显得较亮。
增加图像中字符的粗细。
模糊嘈杂的图像，同时保留字母的边缘。
拉直页面曲率并修复页面照片的相机镜头畸变。

这些滤镜可以组合并应用于整个图像或仅应用于图像的选定区域，以及批处理。您不仅可以在识别管道中微调预处理，还可以存储处理后的图像以供显示、缓存和调试。

针对特定文档类型进行了优化

Aspose.OCR for Python via .NET 提供经过专门训练的神经网络，以最高精度从某些类型的图像中提取文本：

身份证和护照的扫描件或照片。
车辆牌照。
发票。
收据。

内置拼写检查器

虽然 Aspose.OCR for Python via .NET 识别精度高，印刷缺陷、污垢或不标准字体可能会导致某些字符或文字无法正确识别。为了进一步提高识别结果，您可以打开拼写检查器，它会根据所选的识别语言查找并自动纠正拼写错误。

如果识别的文本包含专业术语、缩写词以及其他常见拼写词典中没有的单词，您可以提供自己的单词列表。

创建可搜索的 PDF

即使具有最高的识别精度，原始图像也可能包含大量重要的非文本信息或者仅仅具有巨大的历史价值。 Aspose.OCR for Python via .NET 提供了一个简单而优雅的解决方案，结合了两全其美的优点。我们从图像、PDF 文档或文件包中提取文本，并将其作为不可见的文本层放置在原始图像之上。结果以 PDF 格式保存，这是存储和共享文档的行业标准。可以对生成的文件进行搜索和索引，并且可以选择和复制文本，就像选择和复制原始字符一样。

批量识别

Aspose.OCR for Python via .NET 允许您识别多个文件，无论其数量和类型如何，就像读取单个图像一样简单。通过一次 API 调用，您可以从自动送纸扫描仪中识别多个页面，或从自动交通摄像头中提取车辆牌照。

结果可以保存为可搜索的 PDF 文档或电子表格，或以纯文本、JSON 或 XML 形式返回以供进一步分析。

Support and Learning Resources

为什么 Aspose.OCR for Python via .NET?
客户名单
成功的故事

Download Free Trial Pricing Information

Aspose 还为其他流行的编程语言提供本机 OCR API：

Python 光学字符识别 API

从扫描图像、照片和屏幕截图中提取文本，创建可搜索的 PDF，搜索和比较图像中的文本，等等。

Aspose.OCR for Python via .NET

Overview

乍看上去

平台独立性

支持的文件格式

特性和功能

便于使用

实时代码示例 - Python 3

28种识别语言

强大的处理过滤器

针对特定文档类型进行了优化

内置拼写检查器

创建可搜索的 PDF

批量识别

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++

Aspose.OCR for.NET