Aspose.OCR  for .NET

在 .NET 中将图像和 PDF 转换为文本

只需几行代码,即可将光学字符识别 (OCR) 添加到您的 .NET 应用程序中。

  Download Free Trial
  
 

Aspose.OCR for .NET 是一个功能强大但易于使用且经济高效的光学字符识别 API。有了它,您只需不到 5 行代码就可以将 OCR 功能添加到您的 .NET 应用程序中,而无需担心复杂的数学、神经网络和其他技术细节。我们在机器学习技术方面的经验和多年的开发造就了一个具有卓越速度和准确性的 OCR 引擎,它支持26种基于拉丁文西里尔字母以及中文的语言。 OCR API 可以识别扫描的图像、智能手机照片、屏幕截图、图像区域和扫描的 PDF,并以最流行的文档和数据交换格式返回结果。各种预处理过滤器允许您识别旋转、倾斜和嘈杂的图像。通过将资源密集型计算任务转移到GPU可以进一步提高识别性能和系统负载。

Aspose.OCR for .NET 的特性和功能

将图像和 PDF 转换为文本

支持您可以从扫描仪或相机获得的所有图像格式

阅读基于拉丁文和西里尔文的语言

识别6000多个汉字

检测并识别所有流行的字体

仔细保留字体样式和格式

仅处理整个图像或选定区域

支持旋转、倾斜和嘈杂的图像

批量识别文件夹或存档中的所有图像

识别作为 Web 链接提供的图像

查找并自动更正拼写错误的单词

与其他 Aspose 产品完全兼容

易于安装

Aspose.OCR for .NET 以轻量级 NuGet 包或具有最小依赖性的可下载文件的形式分发。只需将其安装到您的项目中,您就可以识别任何受支持语言的文本并以任何受支持的格式保存识别结果。

申请临时许可证以开始构建功能齐全的 OCR 应用程序,不受任何限制。

便于使用

您需要三行代码来识别图像并显示结果。是的,真的就是这么简单!

图像到文本的 3 行 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 将图像识别为文本
string result = recognitionEngine.RecognizeImage("sample.jpg");

// 显示识别结果
Console.WriteLine(result);

跨平台

该库完全支持 .NET Standard 2.0。这意味着应用程序可以在任何平台上运行:桌面 Windows、Windows Server、macOS、Linux 和云。

26种识别语言

OCR API 可以识别大量语言和所有流行的书写脚本,包括混合语言的文本。

  • 扩展拉丁字母:克罗地亚语、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、意大利语、拉脱维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、西班牙语、瑞典语。
  • 西里尔字母:白俄罗斯语、保加利亚语、哈萨克语、俄语、塞尔维亚语、乌克兰语。
  • 中文:6000多个字符。

您可以将语言检测留给库或自己定义语言以提高识别性能和可靠性。

识别照片

OCR 应用程序的最大障碍是扫描仪对于最终用户来说并不常见。该 API 具有强大的内置图像预处理过滤器,可以处理旋转、倾斜和嘈杂的图像。结合对所有图像格式的支持,它甚至可以可靠地识别智能手机照片。大多数预处理和图像校正都是自动完成的,因此您只需要在困难的情况下进行干预。

应用自动图像校正 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 启用自动偏斜计算和对比
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// 识别图像
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

通用转换器

该 API 几乎可以读取您可以从扫描仪、相机或智能手机获取的任何图像:PDF 文档、JPEG、PNG、TIFF、GIF、BMP 图像,甚至 DjVu 文件。完全支持多页 PDF 文档、TIFF 和 DjVu 图像。您还可以通过 URL 提供来自网络的图像。

识别结果以最流行的文档和数据交换格式返回:纯文本、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。

识别 PDF 并将结果保存到 JSON - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 从扫描的 PDF 中识别所有页面
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// 将每个页面输出为 JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

资源优化

光学字符识别是一个资源密集型过程。 API 提供了非常灵活的方法来在经典的时间-价格-质量三元组中取得平衡:

  • 在彻底识别和快速识别之间进行选择。
  • 指定为识别分配的线程数,或允许库自动缩放到处理器内核数。
  • 通过将计算卸载到 GPU 来释放 CPU。

快速识别 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 以最快的模式识别图像
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

拼写检查

虽然 OCR 产生可靠的结果,但灰尘和打印缺陷可能会导致某些符号被错误识别。 OCR API 有一个内置的拼写检查器,可以自动替换拼写错误的单词,让您不必手动更正识别结果。

拼写检查识别结果 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 启用自动对比
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// 识别图像
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// 纠正拼写错误的单词
string text =  result.GetSpellCheckCorrectedText();

批量处理

OCR API 通过提供各种允许您在一次调用中识别多张图像的批处理方法,让您从一张一张地识别每张图像中解放出来:

  • 识别多页 PDF、TIFF 和 DjVu 文件。
  • 识别文件夹中的所有文件。
  • 识别存档中的所有文件。
  • 识别列表中的所有文件。

以身作则

Aspose.OCR for .NET 附带了许多用 C# 编写的示例,让您可以快速熟悉其功能和能力,并让您了解如何为您的业务需求创建解决方案。

  

Support and Learning Resources

  
  

Aspose 还为其他流行的编程语言提供原生 OCR API: