为什么选择 Aspose.OCR for Python via C++?

通过 C++ 使用 Aspose.OCR for Python 增强您的 OCR 功能。这个功能丰富的库可以使用最少的代码将 OCR 无缝集成到 Python 应用程序中。体验卓越的速度和准确性,支持 130 多种语言,包括拉丁语、西里尔语、阿拉伯语、波斯语、印度语和中文脚本。识别各种图像,从扫描文档和智能手机照片到屏幕截图和扫描 PDF。先进的预处理过滤器可应对旋转、倾斜和噪声图像等挑战,通过利用 GPU 处理确保最佳性能。

Illustration ocr

快速、准确的 OCR

通过 C++ 技术,使用先进的 Python 实现快速、准确的 OCR 结果。

多语言识别

识别 130 多种语言的文本,通过 C++ 集成确保 Python 应用程序的多功能性。

全面的图像支持

通过 C++ 使用 Python 轻松处理来自扫描仪、相机和智能手机的图像。

准确的汉字识别

通过 C++ 精确识别 Python 项目中的 6000 多个汉字。

维护字体样式和格式

保留字体样式和格式,以便通过 C++ 在 Python 应用程序中准确表示已识别的文本。

实时代码示例

只需三行代码即可启动图像文本识别。体验简单!

准备好识别 准备好识别 将文件拖放到此处或单击浏览*

* 通过上传您的文件或使用我们的服务,您同意我们的 使用条款隐私政策.

识别结果
 

将图像转换为文本

更多示例 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);

选择您的偏好

选择适合您需求的库。探索可用的 API 及其功能,以选择最有效的解决方案。

多功能性

Python via .NET

易于开发、代码可读性和可维护性
拥有最多的功能并接收最频繁的更新
整体速度可能比其他平台慢一点

均匀度

Python via Java

在任何平台上使用相同的库
在任何设备上无缝运行您的应用程序
需要 Java 运行时环境 (JRE) 版本 8 或更高版本

表现

Python via C++

无论平台如何,最快的速度
对资源管理的大量控制
针对经验丰富的开发人员

Python 应用程序的 OCR 集成

Aspose.OCR for Python via C++ 与任何支持 C++ 的平台无缝集成 - 无论是桌面 Windows、Windows Server、macOS、Linux ,或云。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for Python via C++ 几乎可以处理任何 文件 您可以通过扫描仪或相机获取。识别结果以最流行的文件和数据交换格式返回,可以保存、导入数据库或实时分析。

图片

  • JPEG
  • PNG
  • TIFF
  • BMP

批量OCR

  • Multi-page PDF
  • ZIP
  • Folder

识别结果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • RTF
  • JSON
  • XML

通过 C++ 轻松安装 Python

Aspose.OCR for Python via C++ 作为 Python 包或具有最小依赖性的 可下载文件 提供。轻松将其 安装 到您的项目中,您就可以识别多种受支持语言的文本并以各种格式保存识别结果。

请求试用许可证 以无限制地开始开发功能齐全的 OCR 应用程序。

Python 应用程序的 C++ 后端集成

我们的库与 C++ 后端无缝集成,使 Python 应用程序能够在任何平台上无缝运行 - 桌面 Windows、Windows Server、macOS、Linux 和云。

130+ 识别语言

支持多种语言和脚本,包括混合语言:

通过让库检测语言或定义语言来优化识别以提高性能。

  • 扩展拉丁字母表:英语、西班牙语、法语、印度尼西亚语、葡萄牙语、德语、越南语、土耳其语、意大利语、波兰语等 80 多种;
  • 西里尔文字母:俄语、乌克兰语、哈萨克语、塞尔维亚语、白俄罗斯语、保加利亚语;
  • 阿拉伯语、波斯语、乌尔都语;
  • 中文和梵文文字,包括印地语、马拉地语、博杰普尔语等。

主要特征

Aspose.OCR for Python via C++ 通过 C++ 探索 Aspose.OCR for Python 的高级功能。

Feature icon

照片识别

以扫描级精度从智能手机照片中提取文本。

Feature icon

可搜索的 PDF

将任何扫描结果转换为完全可搜索和可索引的文档。

Feature icon

网址识别

从 URL 识别图像,无需下载到本地。

Feature icon

批量识别

读取多页文档、文件夹和档案中的所有图像。

Feature icon

任何字体和样式

识别并识别所有流行字体和样式的文本。

Feature icon

微调识别

调整每个 OCR 参数以获得最佳识别结果。

Feature icon

拼写检查器

通过自动更正拼写错误的单词来提高结果。

Feature icon

查找图像中的文本

在一组图像中搜索文本或正则表达式。

Feature icon

比较图像文本

比较两个图像上的文本,无论大小写和布局如何。

Feature icon

限制识别范围

限制 OCR 引擎将查找的字符集。

Feature icon

检测图像缺陷

自动查找图像中可能存在问题的区域。

Feature icon

识别区域

仅查找和读取图像的特定区域,而不是所有文本。

Python 代码示例

发现代码示例,通过 C++ 将 Aspose.OCR for Python 无缝集成到您的应用程序中。

轻松安装

作为轻量级 Python 包或具有最小依赖性的可下载文件,Aspose.OCR for Python via C++ 确保轻松分发。直接从 Python 将其集成到您的项目中,您就可以利用完整的 OCR 功能,以各种格式保存识别结果。

安装后,立即开始通过 C++ 使用 Aspose.OCR for Python,尽管有一定的限制。临时许可证可消除 30 天内的所有试用版限制。利用这段时间开始开发功能齐全的 OCR 应用程序,以便您稍后做出明智的决定是否购买 Aspose.OCR for Python via C++。

文档区域检测

文本文档的图像扫描或照片通常包含多个内容块,包括文本段落、表格、插图、公式等。成功、准确地识别页面上的这些感兴趣区域对于有效的 OCR 至关重要。这一关键过程称为文档区域检测,涉及不同内容区域的识别、组织和分类。

Aspose.OCR 提供了多种文档区域检测算法,允许您选择最适合您的特定内容的一种。

各种图像内容的设置 - Python OCR

settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE

input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)

多种输出格式

C++ 的 OCR 可以以多种格式保存识别结果,以便可以共享、存储在数据库中、显示或分析:纯文本、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。 {index-content-python-cpp.code_samples.item3.content2}

将识别结果保存为 JSON - Python

recognize_result_txt 
    = asposeocr.AsposeOCRSerializeResult(
      recognize_result, 
      asposeocr.ExportFormat.json)