通过 C++ 实现 Python 的 Aspose.OCR 卓越 OCR
使用 Python OCR 进行图像到文本识别
更多展示 >import asposeocr
settings = asposeocr.RecognitionSettings()
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = AsposeOCRRecognize(input_data, settings)
> pip install aspose-ocr-python-cpp
为什么选择 Aspose.OCR for Python via C++?
通过 C++ 使用 Aspose.OCR for Python 增强您的 OCR 功能。这个功能丰富的库可以使用最少的代码将 OCR 无缝集成到 Python 应用程序中。体验卓越的速度和准确性,支持 130 多种语言,包括拉丁语、西里尔语、阿拉伯语、波斯语、印度语和中文脚本。识别各种图像,从扫描文档和智能手机照片到屏幕截图和扫描 PDF。先进的预处理过滤器可应对旋转、倾斜和噪声图像等挑战,通过利用 GPU 处理确保最佳性能。
快速、准确的 OCR
通过 C++ 技术,使用先进的 Python 实现快速、准确的 OCR 结果。
多语言识别
识别 130 多种语言的文本,通过 C++ 集成确保 Python 应用程序的多功能性。
全面的图像支持
通过 C++ 使用 Python 轻松处理来自扫描仪、相机和智能手机的图像。
准确的汉字识别
通过 C++ 精确识别 Python 项目中的 6000 多个汉字。
维护字体样式和格式
保留字体样式和格式,以便通过 C++ 在 Python 应用程序中准确表示已识别的文本。
实时代码示例
只需三行代码即可启动图像文本识别。体验简单!
将图像转换为文本
更多示例 >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);
选择您的偏好
选择适合您需求的库。探索可用的 API 及其功能,以选择最有效的解决方案。
多功能性
Python via .NET
均匀度
Python via Java
表现
Python via C++
Python 应用程序的 OCR 集成
Aspose.OCR for Python via C++ 与任何支持 C++ 的平台无缝集成 - 无论是桌面 Windows、Windows Server、macOS、Linux ,或云。
支持的文件格式
Aspose.OCR for Python via C++ 几乎可以处理任何 文件 您可以通过扫描仪或相机获取。识别结果以最流行的文件和数据交换格式返回,可以保存、导入数据库或实时分析。
图片
- JPEG
- PNG
- TIFF
- BMP
批量OCR
- Multi-page PDF
- ZIP
- Folder
识别结果
- Text
- Microsoft Word
- Microsoft Excel
- RTF
- JSON
- XML
Python 应用程序的 C++ 后端集成
我们的库与 C++ 后端无缝集成,使 Python 应用程序能够在任何平台上无缝运行 - 桌面 Windows、Windows Server、macOS、Linux 和云。
130+ 识别语言
支持多种语言和脚本,包括混合语言:
通过让库检测语言或定义语言来优化识别以提高性能。
- 扩展拉丁字母表:英语、西班牙语、法语、印度尼西亚语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种;
- 西里尔文字母:俄语、乌克兰语、哈萨克语、塞尔维亚语、白俄罗斯语、保加利亚语;
- 阿拉伯语、波斯语、乌尔都语;
- 中文和梵文文字,包括印地语、马拉地语、博杰普尔语等。
主要特征
Aspose.OCR for Python via C++ 通过 C++ 探索 Aspose.OCR for Python 的高级功能。
照片识别
以扫描级精度从智能手机照片中提取文本。
可搜索的 PDF
将任何扫描结果转换为完全可搜索和可索引的文档。
网址识别
从 URL 识别图像,无需下载到本地。
批量识别
读取多页文档、文件夹和档案中的所有图像。
任何字体和样式
识别并识别所有流行字体和样式的文本。
微调识别
调整每个 OCR 参数以获得最佳识别结果。
拼写检查器
通过自动更正拼写错误的单词来提高结果。
查找图像中的文本
在一组图像中搜索文本或正则表达式。
比较图像文本
比较两个图像上的文本,无论大小写和布局如何。
限制识别范围
限制 OCR 引擎将查找的字符集。
检测图像缺陷
自动查找图像中可能存在问题的区域。
识别区域
仅查找和读取图像的特定区域,而不是所有文本。
Python 代码示例
发现代码示例,通过 C++ 将 Aspose.OCR for Python 无缝集成到您的应用程序中。
轻松安装
安装后,立即开始通过 C++ 使用 Aspose.OCR for Python,尽管有一定的限制。临时许可证可消除 30 天内的所有试用版限制。利用这段时间开始开发功能齐全的 OCR 应用程序,以便您稍后做出明智的决定是否购买 Aspose.OCR for Python via C++。
文档区域检测
文本文档的图像扫描或照片通常包含多个内容块,包括文本段落、表格、插图、公式等。成功、准确地识别页面上的这些感兴趣区域对于有效的 OCR 至关重要。这一关键过程称为文档区域检测,涉及不同内容区域的识别、组织和分类。Aspose.OCR 提供了多种文档区域检测算法,允许您选择最适合您的特定内容的一种。
各种图像内容的设置 - Python OCR
settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)
多种输出格式
C++ 的 OCR 可以以多种格式保存识别结果,以便可以共享、存储在数据库中、显示或分析:纯文本、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。 {index-content-python-cpp.code_samples.item3.content2}
将识别结果保存为 JSON - Python
recognize_result_txt
= asposeocr.AsposeOCRSerializeResult(
recognize_result,
asposeocr.ExportFormat.json)