Python OCR 库
使用 Python OCR 将图像转换为文本
更多展示 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
为什么选择 Aspose.OCR for Python via .NET?
通过 .NET 踏上 Aspose OCR for Python 之旅——一种多功能且用户友好的 OCR API。只需不到 5 行代码即可将 OCR 功能嵌入到您的 Python 应用程序中,无需复杂的数学或神经网络。我们强大的 OCR 引擎提供无与伦比的速度和准确性,支持 130 多种语言,包括英语、西里尔语、阿拉伯语、波斯语、印地语、中文、日语、韩语、泰米尔语等。无论是扫描图像、智能手机照片、屏幕截图还是扫描 PDF,都能以流行的文档和数据交换格式获得结果。利用预处理滤波器来处理旋转、倾斜和噪声图像。
高效精准的OCR
借助先进的 Python 技术,体验 OCR 结果无与伦比的速度和精度。
多种语言
识别 140 多种语言的文本:英语、法语、德语、西班牙语、俄语、中文、印地语、日语、韩语、泰米尔语、阿拉伯语、波斯语等。
普遍的
使用 Python 轻松处理来自不同来源(扫描仪、相机和智能手机)的图像。
亚洲语言
实现中文、阿拉伯文、梵文和德拉威文字以及混合语言文本的精确识别。
保留布局
维护源格式以实现准确的文本表示并识别表格。
实时代码示例
只需三行 Python 代码即可将图像转换为文本。自己尝试一下吧!
将图像转换为文本
发现更多示例 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
选择您的偏好
选择适合您需求的库。探索可用的 API 及其功能,以选择最有效的解决方案。
多功能性
Python via .NET
均匀度
Python via Java
表现
Python via C++
到处跑
无论名称如何,Aspose.OCR for Python via .NET 不需要在目标平台上安装 .NET。安装包已附带所有必需的组件,并且可以在任何平台上无缝运行 - 无论是本地计算机、Web 服务器还是云。
支持的文件格式
Aspose.OCR for Python via .NET 可以处理任何 文件 您可以通过扫描仪或相机获取。识别结果可以保存、导入数据库或实时分析。
图片
- JPEG
- PNG
- TIFF
- BMP
- GIF
批量OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
识别结果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Python 下的 OCR
我们的库可以轻松集成,使 Python 应用程序能够在任何平台上无缝运行 - 桌面 Windows、Windows Server、macOS、Linux 和云。
140+ 识别语言
我们的 Java OCR 库是全球范围内文档处理、数据提取和内容数字化的通用解决方案。它支持大量欧洲、中东和亚洲书写脚本,非常适合任何国家和企业。
Aspose OCR for Java 可识别多语言文档中的文本,例如中文/英语、阿拉伯语/法语或西里尔语/英语。支持以下语言:
- 扩展拉丁语:英语、西班牙语、法语、印度尼西亚语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种;
- 西里尔文字母表:俄语、乌克兰语、哈萨克语、保加利亚语,包括混合西里尔语/英语文本;
- 阿拉伯语、波斯语、乌尔都语,包括与英语混合的文本;
- 中文、韩语、日语、梵文和德拉威语,包括印地语、泰米尔语、马拉地语等。还支持混合语言文本。
强大的处理过滤器
光学字符识别的准确性和可靠性很大程度上取决于原始图像的质量。 Aspose OCR for Python via .NET 提供大量全自动和手动图像处理过滤器,可在将图像发送到 OCR 引擎之前对其进行增强:
- 自动旋转颠倒和旋转图像。
- 检测倒置图像并提取黑底白字。
- 自动去除污垢、斑点、划痕、眩光、不需要的渐变和其他噪音。
- 自动调整图像对比度。
- 自动放大或手动调整图像大小。
- 将图像转换为黑白或灰度。
- 查找图像中潜在问题的区域并返回有关缺陷类型及其坐标的信息。
- 增加图像中字符的粗细。
- 模糊嘈杂的图像,同时保留字母的边缘。
- 拉直页面曲率并修复页面照片的相机镜头失真。
针对特定文档类型进行了优化
Aspose OCR for Python via .NET 提供经过专门训练的神经网络,可以以最高的准确度从某些类型的图像中提取文本:
内置拼写检查器
虽然我们的Python OCR库提供了很高的识别精度,但打印缺陷、污垢或非标准字体可能会导致某些字符或单词被错误识别。为了进一步提高识别结果,您可以打开拼写检查器,它会根据所选的识别语言查找并自动纠正拼写错误。
如果识别的文本包含专业术语、缩写词以及常见拼写词典中不存在的其他单词,您可以提供自己的单词列表。
批量识别
我们的 Python OCR API 将您从一张一张识别图像中解放出来。采用各种批处理方法在一次调用中识别多个图像:
- 识别多页 PDF、TIFF 和 DjVu 文件。
- 识别文件夹中的所有文件。
- 识别存档中的所有文件。
- 识别列表中的所有文件。
通过样本学习
Python 版 OCR 提供了一系列用 Python 编写的示例,让您快速熟悉其功能和功能。获得有关创建定制解决方案以满足您的 Python 业务需求的见解。
特性和功能
Aspose.OCR for Python via .NET 快速轻松地解决您的任务。
照片识别
以扫描级精度从智能手机照片中提取文本。
可搜索的 PDF
将任何扫描件转换为完全可搜索、可索引和可编辑的文档。
网址识别
从 URL 识别图像,无需下载到本地。
批量识别
读取多页文档、文件夹和档案中的所有图像。
任何字体和样式
识别并识别所有流行字体和样式的文本。
微调识别
调整每个 OCR 参数以获得最佳识别结果。
拼写检查器
通过自动更正拼写错误的单词来提高结果。
查找图像中的文本
在一组图像中搜索文本或正则表达式。
比较图像文本
比较两个图像上的文本,无论大小写和布局如何。
Python 代码示例
深入研究代码示例,将 OCR 无缝集成到您的 Python 应用程序中。
安装
Aspose.OCR for Python via .NET 作为 Python Wheel 或独立的可下载包进行分发,很容易分发。直接从您首选的 Python 集成开发环境 (IDE) 集成到您的 Python 项目是一个无缝的过程。只需安装它,您就可以利用完整的 OCR 功能,以各种格式保存识别结果。
安装后,您可以立即开始通过 .NET 使用 Aspose.OCR for Python ,尽管有一定的限制。临时许可证可解除 30 天内的所有试用版限制。利用这段时间开始开发功能齐全的 OCR 应用程序,以便您在稍后阶段做出明智的决定是否通过 .NET 购买 Aspose.OCR for Python。
加载许可证
lic = License()
lic.set_license(self.licPath)
识别照片上的文字
从 Aspose OCR for Python 中的任何内容读取文本就像调用通用识别方法一样简单。
将照片转换为文本 - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python 通用转换器
我们的 API 能够熟练地读取来自扫描仪、相机或智能手机的任何图像:PDF 文档、JPEG、PNG、TIFF、GIF、BMP 图像,甚至 DjVu 文件。对多页 PDF 文档、TIFF 和 DjVu 图像的全面支持确保了多功能性。您还可以通过 URL 提供来自网络的图像。
识别结果以流行的文档和数据交换格式返回:纯文本、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。
识别 PDF 并将结果保存为各种输出格式 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Python 中的资源优化
光学字符识别需要资源。我们的 API 提供了灵活的方法来平衡经典的时间-价格-质量三元组:
- 在彻底识别和快速识别之间进行选择。
- 指定分配用于识别的线程数,或允许库自动缩放到处理器核心的数量。
- 通过将计算卸载到 .NET 后端来释放 CPU。
快速识别——Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
识别单行
如果您的图像已被修剪为单行文本,则可以以最快的模式对其进行识别,而无需自动更正、内容结构检测和其他消耗资源的步骤。它可以将 OCR 速度比正常识别过程快 7 倍。
识别图像上的单行文本 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)