為什麼選擇Aspose OCR庫?

在幾秒鐘內,在.NET應用程序中構建強大的OCR功能。我們易於使用的OCR API使您可以從圖像和掃描中提取文本,創建可搜索的PDF以及最小C#代碼的更多內容。適用於.NET桌面,Web,雲和無服務器功能的理想選擇。
體驗OCR不僅提取文本,而且可以通過AI理解和增強它。單擊下面的項目以了解有關我們的功能和好處的更多信息。

Illustration ocr

全球OCR應用

C#OCR認可英語,西里爾,阿拉伯語,波斯語,中文,日語,韓語,印地語,泰米爾語和混合語言。

閱讀所有內容

從通過掃描儀或相機獲得的任何文件中獲取文本,然後直接從Web鏈接處理圖像。

可靠的結果

對於所有圖像,包括異常,旋轉,扭曲和嘈雜的圖像,實現高識別精度。

批識別

從文件夾和檔案中批准所有圖像;閱讀多頁PDF文檔和TIFF圖像。

佈局檢測

識別圖像中的內容塊並分類,以確保提取的文本的正確順序,無論佈局如何。

AI使用LLMS進行後處理

不僅是OCR,還可以使用智能,無錯誤的文本識別的多合一AI解決方案。 ASPOSE.OCR現在集成了AI和LLM,以選擇可顯著提高OCR準確性的模型 - 固定錯誤,恢復缺失的文本以及提高整體識別質量。

實時代碼樣本

.NET OCR即使對於新開發人員,也可以使用Aspose OCR API成為一項瑣碎而直接的任務。只有幾行代碼足以從圖像中提取文本並在屏幕上顯示。真的很簡單 - 嘗試一下。

準備識別 準備識別 在此處放置文件或單擊瀏覽 *

*通過上傳文件或使用您同意我們的服務 使用條款隱私政策.

識別結果
 

將圖像轉換為文字

更多例子 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

平台獨立性

跨平台OCR庫可以在.NET,.NET CORE或.NET FRAMERK下工作[無處不在](https://docs.aspose.com/ocr/net/net/system-requirements/) - 無論是在本地計算機,在Web服務器上還是在雲中。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for .NET 可以使用任何 文件 您可以從掃描儀或相機中獲得。識別結果可以保存,導入到數據庫或實時分析。

圖像

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

批量OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

識別結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

LLM驅動的OCR:由AI語言模型驅動的下一代OCR。

結果準確性不會停止識別 - 通過使用外部LLM來提煉文本來解鎖下一個質量的水平。

  • 在公認的文本中自動糾正拼寫和語法。
  • 將跨多頁掃描範圍的不一致和格式化問題歸一化。
  • 使用及時驅動的模型適應特定於主題的詞彙的結果。
  • 僅使用幾行代碼將任何外部LLM管道集成到您的OCR工作流程中。

適合任何內容

C#中文本識別的準確性和可靠性在很大程度上取決於圖像質量。 .NET OCR提供了一套完整的自動和手動圖像優化,從而確保了出色的識別結果。

功能強大的圖像處理,完全可自定義的文本檢測,後處理和自動拼寫校正,可以從任何掃描或照片中提取文本,以最高的精度提取。

OCR資源優化

Aspose’C#OCR庫可以為每種特定用例提供高度靈活的識別速度,質量和資源利用率:

  • 在透徹識別和快速識別之間進行選擇。
  • 指定分配識別的線程數,或允許我們的.NET OCR庫自動擴展到處理器內核的數量。
  • 通過將計算釋放到GPU來釋放CPU。

140多種識別語言

我們的C#OCR庫是在全球範圍內用於文檔處理,數據提取和內容數字化的通用解決方案。為了支持各種歐洲,中東和亞洲寫作腳本,它適合任何國家和商業。

您可以識別使用混合語言編寫的文檔,例如中文/英語,阿拉伯語/法語或西里爾/英語。支持以下語言:

  • 擴展拉丁語:英語,西班牙語,法語,印尼,葡萄牙語,德國,越南語,土耳其語,意大利語,波蘭語和80歲以上;
  • 西里爾字母:俄羅斯,烏克蘭,哈薩克,保加利亞人,包括混合的西里爾/英語文本;
  • 阿拉伯語,波斯語,烏爾都語,包括與英語混合的文字;
  • 中文,韓國,日本,德文納加里和德拉維語,包括印地語,泰米爾語,馬拉地語等。

功能和功能

C#OCR自動從照片或掃描中提取文本,從而消除了對文檔的手動重新測試的需求。

Feature icon

照片OCR

從智能手機照片中提取文字,具有掃描級別的精度。

Feature icon

可搜索的PDF

將任何掃描轉換為完全可搜索且可索引的文檔。

Feature icon

URL識別

識別來自URL的圖像而無需在本地下載。

Feature icon

散裝認可

閱讀來自多頁文檔,文件夾和檔案的所有圖像。

Feature icon

任何字體和样式

識別並識別所有流行字體和样式中的文本。

Feature icon

微調識別

調整每個OCR參數以獲得最佳識別結果。

Feature icon

拼寫檢查器

通過自動糾正拼寫錯誤的單詞來改善結果。

Feature icon

在圖像中找到文字

在一組圖像中搜索文本或正則表達式。

Feature icon

比較圖像文本

無論情況和佈局如何,都比較兩個圖像上的文本。

Feature icon

AI驅動的校正

使用基於變壓器的LLM修復錯誤認可的單詞和語法 - 無需定制培訓。

Feature icon

語義後處理

超越字符:使用LLM的嘈雜的OCR輸出來提高內容質量和語言歸一化。

Feature icon

插件LLM管道

連接外部語言模型以糾正OCR識別錯誤,並恢復不完整或零散的文本。

易於使用的OCR

使用我們的C#OCR API,您只需要幾行C#代碼即可將圖像轉換為文本,創建可搜索的PDF,保存識別結果以進行文檔,等等。探索代碼示例,以了解如何將OCR API集成到您的.NET解決方案中。

安裝

。可以直接從Microsoft Visual Studio添加該軟件包。只需將其安裝到您的項目中,您就可以從圖像中提取文本並以任何支持格式保存識別結果。如果您的系統具有CUDA功能強大的GPU,則可以使用[gpu-accelerated OCR引擎](https://docs.aspose.com/ocr/net/inet/installation/gpu/)顯著提高識別性能。

您可以在安裝後立即使用Aspose OCR使用一些[限制](https://docs.aspose.com/ocr/net/licensing/)。臨時許可將刪除30天的試用版的所有限制。使用它開始構建功能齊全的OCR應用程序,並最終決定以後購買.NET的OCR。

從照片中提取文字

當人們通常會想到OCR(光學特徵識別)時,第一個關聯通常與掃描儀作為主要捕獲裝置。該關聯有歷史原因,並且在許多情況下仍然很普遍,提供了一致且受控的環境,用於以無與倫比的質量從物理文檔中捕獲印刷文本。但是,掃描儀是專業設備,並不總是在手頭,需要固定的工作站才能操作。幸運的是,現代世界為傳統掃描儀提供了方便的替代品 - 智能手機相機。智能手機相機技術的進步確保即使是入門級智能手機也提供了足夠的質量來捕獲OCR就緒文檔。內置的內存使數字化大量文檔,報紙,書籍,街道標誌和其他文本比以往任何時候都更容易。您需要的是正確的技術,將這些照片轉換為可讀的文本。

我們的C#OCR庫是專門設計的,可以識別所有類型的圖像,並且可以進一步調整以處理甚至低質量的照片。結合現代智能手機,它使您可以為大多數日常掃描和文本識別任務創建強大的OCR應用程序。最先進的圖像處理和文檔結構分析是在幾行代碼中執行的,使您可以專注於業務而不是複雜的數學算法,神經網絡和其他技術複雜性。

照片OCR -C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

從掃描中創建可搜索的PDF

PDF是用於掃描紙質文檔的最受歡迎的格式之一,尤其是由於其能夠將多個頁面組合到單個文件中。這種格式被廣泛用於交換合同,發票,法律文件,護照和身份證,以及個人,企業,銀行和政府機構之間的許多其他文件。但是,任何掃描的PDF本質上都是圖像集合。它不包含機器可讀文本,因此用戶無法搜索,複製或以其他方式操縱文檔內容。

aspose .NET OCR為您提供一種快速,簡單且高度可靠的方法,可以將任何掃描的PDF轉換為可搜索和可索引的文檔。它準確地識別了頁面內容,將其轉換為可以選擇,複製,通過文本到語音軟件讀取的原始圖像,甚至由翻譯人員,摘要和其他AI驅動分析工具自動處理的原始圖像。

將文本疊加添加到PDF -C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

在圖像中搜索文字

數字檔案,尤其是在大型組織中,通常包括大量的掃描和照片,其中許多可能包含多頁文檔。有效的有效管理和組織對於簡單的信息檢索和導航至關重要。但是,圖像不包含機器可讀文本,因此無法搜索和分析文檔內容。

C#OCR庫允許您輕鬆地在圖像中搜索文本,無論字體,文本大小,樣式和其他參數如何。該圖書館還支持對案例不敏感的搜索和正則表達式,這些搜索在各種應用程序和行業中非常有用。此功能可用於根據文本中的內容,關鍵字或模式對文檔進行分類。在協議和合同中搜索特定條款或條款;根據其中發現的關鍵字或內容重新組織文件;在文檔中找到並確定個人數據,從而更容易確保GDPR合規性和更有效地管理敏感信息。使用圖像進行搜索還可以在收到簽名的合同和發票後創建自動化工作流程,並簡化各種業務流程。

在圖像中搜索文字-C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

AI與LLM的後處理

現在,您可以超越原始識別,並應用AI驅動的邏輯以提高OCR結果的文本質量。大型語言模型(LLMS)可以明智地糾正拼寫錯誤,恢復單詞邊界,應用語法規則並基於上下文調整文本 - 基於語法的拼寫檢查器無法做到這一點。

此後處理步驟是低質量掃描,帶有背景噪聲或多語言文檔的理想選擇。您可以插入任何支持基本文本輸入/輸出的LLM管道,也可以使用Aspose的內置智能校正工具來獲得生產準備就緒結果。

llm - C#的後處理

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();