为什么选择Aspose OCR库?

在几秒钟内,在.NET应用程序中构建强大的OCR功能。我们易于使用的OCR API使您可以从图像和扫描中提取文本,创建可搜索的PDF以及最小C#代码的更多内容。适用于.NET桌面,Web,云和无服务器功能的理想选择。
体验OCR不仅提取文本,而且可以通过AI理解和增强它。单击下面的项目以了解有关我们的功能和好处的更多信息。

Illustration ocr

全球OCR应用

C#OCR认可英语,西里尔,阿拉伯语,波斯语,中文,日语,韩语,印地语,泰米尔语和混合语言。

阅读所有内容

从通过扫描仪或相机获得的任何文件中获取文本,然后直接从Web链接处理图像。

可靠的结果

对于所有图像,包括异常,旋转,扭曲和嘈杂的图像,实现高识别精度。

批识别

从文件夹和档案中批准所有图像;阅读多页PDF文档和TIFF图像。

布局检测

识别图像中的内容块并分类,以确保提取的文本的正确顺序,无论布局如何。

AI使用LLMS进行后处理

不仅是OCR,还可以使用智能,无错误的文本识别的多合一AI解决方案。 ASPOSE.OCR现在集成了AI和LLM,以选择可显着提高OCR准确性的模型 - 固定错误,恢复缺失的文本并提高整体识别质量。

实时代码样本

.NET OCR即使对于新开发人员,也可以使用Aspose OCR API成为一项琐碎而直接的任务。只有几行代码足以从图像中提取文本并在屏幕上显示。真的很简单 - 尝试一下。

准备识别 准备识别 在此处放置文件或单击浏览 *

*通过上传文件或使用您同意我们的服务 使用条款隐私政策.

识别结果
 

将图像转换为文字

更多例子 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

平台独立性

跨平台OCR库可以在.NET,.NET CORE或.NET FRAMERK下工作[无处不在](https://docs.aspose.com/ocr/net/net/system-requirements/) - 无论是在本地计算机,在Web服务器上还是在云中。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for .NET 可以使用任何 文件 您可以从扫描仪或相机中获得。识别结果可以保存,导入到数据库或实时分析。

图像

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

批量OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

识别结果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

LLM驱动的OCR:由AI语言模型驱动的下一代OCR。

结果准确性不会停止识别 - 通过使用外部LLM来提炼文本来解锁下一个质量的水平。

  • 在公认的文本中自动纠正拼写和语法。
  • 将跨多页扫描范围的不一致和格式化问题归一化。
  • 使用及时驱动的模型适应特定于主题的词汇的结果。
  • 仅使用几行代码将任何外部LLM管道集成到您的OCR工作流程中。

适合任何内容

C#中文本识别的准确性和可靠性在很大程度上取决于图像质量。 .NET OCR提供了一套完整的自动和手动图像优化,从而确保了出色的识别结果。

功能强大的图像处理,完全可自定义的文本检测,后处理和自动拼写校正,可以从任何扫描或照片中提取文本,以最高的精度提取。

OCR资源优化

Aspose’C#OCR库可以为每种特定用例提供高度灵活的识别速度,质量和资源利用率:

  • 在透彻识别和快速识别之间进行选择。
  • 指定分配识别的线程数,或允许我们的.NET OCR库自动扩展到处理器内核的数量。
  • 通过将计算释放到GPU来释放CPU。

140多种识别语言

我们的C#OCR库是在全球范围内用于文档处理,数据提取和内容数字化的通用解决方案。为了支持各种欧洲,中东和亚洲写作脚本,它适合任何国家和商业。

您可以识别使用混合语言编写的文档,例如中文/英语,阿拉伯语/法语或西里尔/英语。支持以下语言:

  • 扩展拉丁语:英语,西班牙语,法语,印尼,葡萄牙语,德国,越南语,土耳其语,意大利语,波兰语和80岁以上;
  • 西里尔字母:俄罗斯,乌克兰,哈萨克,保加利亚人,包括混合的西里尔/英语文本;
  • 阿拉伯语,波斯语,乌尔都语,包括与英语混合的文字;
  • 中文,韩国,日本,德文纳加里和德拉维语,包括印地语,泰米尔语,马拉地语等。

功能和功能

C#OCR自动从照片或扫描中提取文本,从而消除了对文档的手动重新测试的需求。

Feature icon

照片OCR

从智能手机照片中提取文字,具有扫描级别的精度。

Feature icon

可搜索的PDF

将任何扫描转换为完全可搜索且可索引的文档。

Feature icon

URL识别

识别来自URL的图像而无需在本地下载。

Feature icon

散装认可

阅读来自多页文档,文件夹和档案的所有图像。

Feature icon

任何字体和样式

识别并识别所有流行字体和样式中的文本。

Feature icon

微调识别

调整每个OCR参数以获得最佳识别结果。

Feature icon

拼写检查器

通过自动纠正拼写错误的单词来改善结果。

Feature icon

在图像中找到文字

在一组图像中搜索文本或正则表达式。

Feature icon

比较图像文本

无论情况和布局如何,都比较两个图像上的文本。

Feature icon

AI驱动的校正

使用基于变压器的LLM修复错误认可的单词和语法 - 无需定制培训。

Feature icon

语义后处理

超越字符:使用LLM的嘈杂的OCR输出来提高内容质量和语言归一化。

Feature icon

插件LLM管道

连接外部语言模型以纠正OCR识别错误,并恢复不完整或零散的文本。

易于使用的OCR

使用我们的C#OCR API,您只需要几行C#代码即可将图像转换为文本,创建可搜索的PDF,保存识别结果以进行文档,等等。探索代码示例,以了解如何将OCR API集成到您的.NET解决方案中。

安装

。可以直接从Microsoft Visual Studio添加该软件包。只需将其安装到您的项目中,您就可以从图像中提取文本并以任何支持格式保存识别结果。如果您的系统具有CUDA功能强大的GPU,则可以使用[gpu-accelerated OCR引擎](https://docs.aspose.com/ocr/net/inet/installation/gpu/)显着提高识别性能。

您可以在安装后立即使用Aspose OCR使用一些[限制](https://docs.aspose.com/ocr/net/licensing/)。临时许可将删除30天的试用版的所有限制。使用它开始构建功能齐全的OCR应用程序,并最终决定以后购买.NET的OCR。

从照片中提取文字

当人们通常会想到OCR(光学特征识别)时,第一个关联通常与扫描仪作为主要捕获装置。该关联有历史原因,并且在许多情况下仍然很普遍,提供了一致且受控的环境,用于以无与伦比的质量从物理文档中捕获印刷文本。但是,扫描仪是专业设备,并不总是在手头,需要固定的工作站才能操作。幸运的是,现代世界为传统扫描仪提供了方便的替代品 - 智能手机相机。智能手机相机技术的进步确保即使是入门级智能手机也提供了足够的质量来捕获OCR就绪文档。内置的内存使数字化大量文档,报纸,书籍,街道标志和其他文本比以往任何时候都更容易。您需要的是正确的技术,将这些照片转换为可读的文本。

我们的C#OCR库是专门设计的,可以识别所有类型的图像,并且可以进一步调整以处理甚至低质量的照片。结合现代智能手机,它使您可以为大多数日常扫描和文本识别任务创建强大的OCR应用程序。最先进的图像处理和文档结构分析是在几行代码中执行的,使您可以专注于业务而不是复杂的数学算法,神经网络和其他技术复杂性。

照片OCR -C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

从扫描中创建可搜索的PDF

PDF是用于扫描纸质文档的最受欢迎的格式之一,尤其是由于其能够将多个页面组合到单个文件中。这种格式被广泛用于交换合同,发票,法律文件,护照和身份证,以及个人,企业,银行和政府机构之间的许多其他文件。但是,任何扫描的PDF本质上都是图像集合。它不包含机器可读文本,因此用户无法搜索,复制或以其他方式操纵文档内容。

aspose .NET OCR为您提供一种快速,简单且高度可靠的方法,可以将任何扫描的PDF转换为可搜索和可索引的文档。它准确地识别了页面内容,将其转换为可以选择,复制,通过文本到语音软件读取的原始图像,甚至由翻译人员,摘要和其他AI驱动分析工具自动处理的原始图像。

将文本叠加添加到PDF -C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

在图像中搜索文字

数字档案,尤其是在大型组织中,通常包括大量的扫描和照片,其中许多可能包含多页文档。有效的有效管理和组织对于简单的信息检索和导航至关重要。但是,图像不包含机器可读文本,因此无法搜索和分析文档内容。

C#OCR库允许您轻松地在图像中搜索文本,无论字体,文本大小,样式和其他参数如何。该图书馆还支持对案例不敏感的搜索和正则表达式,这些搜索在各种应用程序和行业中非常有用。此功能可用于根据文本中的内容,关键字或模式对文档进行分类。在协议和合同中搜索特定条款或条款;根据其中发现的关键字或内容重新组织文件;在文档中找到并确定个人数据,从而更容易确保GDPR合规性和更有效地管理敏感信息。使用图像进行搜索还可以在收到签名的合同和发票后创建自动化工作流程,并简化各种业务流程。

在图像中搜索文字-C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

AI与LLM的后处理

现在,您可以超越原始识别,并应用AI驱动的逻辑以提高OCR结果的文本质量。大型语言模型(LLMS)可以明智地纠正拼写错误,恢复单词边界,应用语法规则并基于上下文调整文本 - 基于语法的拼写检查器无法做到这一点。

此后处理步骤是低质量扫描,带有背景噪声或多语言文档的理想选择。您可以插入任何支持基本文本输入/输出的LLM管道,也可以使用Aspose的内置智能校正工具来获得生产准备就绪结果。

llm - C#的后处理

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();