为什么选择aspose.ocr为python通过C ++选择?

通过C ++使用Aspose.ocr来增强OCR功能。此功能包装的库无缝将OCR集成到Python应用程序中,并使用最小的代码集成。体验出色的速度和准确性,支持140多种语言,包括拉丁语,西里尔,阿拉伯语,波斯语,指示和中文脚本。识别从扫描的文档和智能手机照片到屏幕截图和扫描PDF的各种图像。先进的预处理过滤器应对旋转,偏斜和嘈杂的图像等挑战,从而通过利用GPU处理来确保最佳性能。

Illustration ocr

迅速而精确的OCR

通过C ++技术,使用最先进的Python实现快速准确的OCR结果。

多语言识别

以140多种语言识别文本,通过C ++集成确保Python应用程序的多功能性。

全面的图像支持

通过C ++轻松地从扫描仪,相机和智能手机中处理图像。

准确的汉字认可

通过C ++,在Python项目中精确地认识了6,000多个汉字。

维护字体样式和格式化

保留字体样式和格式化,以通过C ++在Python应用程序中准确表示已识别的文本。

实时代码样本

仅以三行代码中的图像启动文本识别。体验简单!

准备识别 准备识别 在此处放置文件或单击浏览 *

*通过上传文件或使用您同意我们的服务 使用条款隐私政策.

识别结果
 

将图像转换为文字

更多例子 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);

选择您的偏好

为您的需求选择合适的库。探索可用的API及其选择最有效解决方案的功能。

多功能性

Python via .NET

代码的易于开发,可读性和可维护性
拥有最多的功能并获得最频繁的更新
总体速度可能比其他平台慢一点

统一

Python via Java

在任何平台上使用相同的库
在任何设备上无缝运行您的应用程序
需要Java运行时环境(JRE)版本8或更高版本

表现

Python via C++

无论平台如何,最快的速度
对资源管理的大量控制
针对经验丰富的开发人员

Python应用的OCR集成

aspose.ocr for Python通过C ++通过支持[C ++]的任何平台(https://docs.aspose.com/ocr/python-cpp/system-requirements/)无缝集成 - 无论是在桌面Windows,Windows Server,MacOS,Linux,Linux还是云上。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for Python via C++ 可以使用任何 文件 您可以从扫描仪或相机中获得。识别结果可以保存,导入到数据库或实时分析。

图像

  • JPEG
  • PNG
  • TIFF
  • BMP

批量OCR

  • Multi-page PDF
  • ZIP
  • Folder

识别结果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • RTF
  • JSON
  • XML

通过C ++轻松安装Python

python通过C ++作为Python软件包或[可下载文件](https://releases.aspose.com/ocr/python-cpp/)以最小的依赖关系传递。轻松[install](https://docs.aspose.com/ocr/python-cpp/installation/)它进入您的项目,您可以用多种支持语言识别文本并以各种格式识别识别结果。

[请求试用许可证](https://purchase.aspose.com/temporary-license),以启动无限制的功能性OCR应用程序的开发。

Python应用的C ++后端集成

我们的库与C ++后端无缝集成,使Python应用程序可以在任何平台上无缝运行 - 桌面Windows,Windows Server,Macos,Linux和Cloud。

140多种识别语言

支持各种语言和脚本,包括混合语言:

通过让库检测语言或定义以提高性能来优化识别。

  • 延长拉丁语字母:英语,西班牙语,法语,印尼,葡萄牙语,德国,越南语,土耳其语,意大利语,波兰语等80岁以上;
  • 西里尔字母:俄罗斯,乌克兰,哈萨克,塞尔维亚,白俄罗斯,保加利亚语;
  • 阿拉伯语,波斯语,乌尔都语;
  • 中文和devanagari剧本,包括印地语,马拉地语,博伊布里等。

关键功能

Aspose.OCR for Python via C++ 通过C ++探索aspose.ocr的高级功能。

Feature icon

照片OCR

从智能手机照片中提取文字,具有扫描级别的精度。

Feature icon

可搜索的PDF

将任何扫描转换为完全可搜索且可索引的文档。

Feature icon

URL识别

识别来自URL的图像而无需在本地下载。

Feature icon

散装认可

阅读来自多页文档,文件夹和档案的所有图像。

Feature icon

任何字体和样式

识别并识别所有流行字体和样式中的文本。

Feature icon

微调识别

调整每个OCR参数以获得最佳识别结果。

Feature icon

拼写检查器

通过自动纠正拼写错误的单词来改善结果。

Feature icon

在图像中找到文字

在一组图像中搜索文本或正则表达式。

Feature icon

比较图像文本

无论情况和布局如何,都比较两个图像上的文本。

Feature icon

限制识别范围

限制OCR引擎将要寻找的字符集。

Feature icon

检测图像缺陷

自动发现图像的潜在问题领域。

Feature icon

认识区域

找到并仅读取图像的特定区域,而不是全部文本。

Python代码样本

发现代码样本以通过C ++无缝将Aspose.ocr集成到您的应用程序中。

轻松安装

作为轻巧的Python软件包或具有最小依赖性的可下载文件,Aspose.ocr for Python通过C ++确保了简单的分发。将其直接从Python集成到您的项目中,您准备好利用完整的OCR功能,以节省各种格式的识别能力。

后安装后,迅速开始使用aspose.ocr。临时许可将删除30天的所有试用版本限制。利用此期间来启动功能齐全的OCR应用程序的开发,从而使您可以在稍后通过C ++做出明智的购买aspose.ocr。

文件区域检测

文本文档的图像扫描或照片通常包括多个内容块,包括文本段落,表,插图,公式等。成功,准确地识别页面上这些感兴趣的领域对于有效的OCR至关重要。这个关键过程称为文档区域检测,涉及不同内容区域的识别,组织和分类。

Aspose.ocr提供了几种文档区域检测算法,使您可以选择最适合特定内容的文档检测算法。

定型图像内容的设置-Python OCR

settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE

input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)

各种输出格式

C ++的OCR可以以多种格式保存识别结果,因此可以将它们共享,存储在数据库中,显示或分析:纯文本,PDF,Microsoft Word,Microsoft Word,Microsoft Excel,JSON和XML。 {index-content-python-cpp.code_samples.item3.content2}

将识别结果保存到JSON -Python

recognize_result_txt 
    = asposeocr.AsposeOCRSerializeResult(
      recognize_result, 
      asposeocr.ExportFormat.json)