Aspose.OCR  for .NET

在 .NET 中將圖像和 PDF 轉換為文本

只需幾行代碼,即可將光學字符識別 (OCR) 添加到您的 .NET 應用程序中。

  Download Free Trial
  
 

Aspose.OCR for .NET 是一個功能強大但易於使用且經濟高效的光學字符識別 API。有了它,您只需不到 5 行代碼就可以將 OCR 功能添加到您的 .NET 應用程序中,而無需擔心複雜的數學、神經網絡和其他技術細節。我們在機器學習技術方面的經驗和多年的開發造就了一個具有卓越速度和準確性的 OCR 引擎,它支持26種基於拉丁文西里爾字母以及中文的語言。 OCR API 可以識別掃描的圖像、智能手機照片、屏幕截圖、圖像區域和掃描的 PDF,並以最流行的文檔和數據交換格式返回結果。各種預處理過濾器允許您識別旋轉、傾斜和嘈雜的圖像。通過將資源密集型計算任務轉移到GPU可以進一步提高識別性能和系統負載。

Aspose.OCR for .NET 的特性和功能

將圖像和 PDF 轉換為文本

支持您可以從掃描儀或相機獲得的所有圖像格式

閱讀基於拉丁文和西里爾文的語言

識別6000多個漢字

檢測並識別所有流行的字體

仔細保留字體樣式和格式

僅處理整個圖像或選定區域

支持旋轉、傾斜和嘈雜的圖像

批量識別文件夾或存檔中的所有圖像

識別作為 Web 鏈接提供的圖像

查找並自動更正拼寫錯誤的單詞

與其他 Aspose 產品完全兼容

易於安裝

Aspose.OCR for .NET 以輕量級 NuGet 包或具有最小依賴性的可下載文件的形式分發。只需將其安裝到您的項目中,您就可以識別任何受支持語言的文本並以任何受支持的格式保存識別結果。

申請臨時許可證以開始構建功能齊全的 OCR 應用程序,不受任何限制。

便於使用

您需要三行代碼來識別圖像並顯示結果。是的,真的就是這麼簡單!

圖像到文本的 3 行 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 將圖像識別為文本
string result = recognitionEngine.RecognizeImage("sample.jpg");

// 顯示識別結果
Console.WriteLine(result);

跨平台

該庫完全支持 .NET Standard 2.0。這意味著應用程序可以在任何平台上運行:桌面 Windows、Windows Server、macOS、Linux 和雲。

26種識別語言

OCR API 可以識別大量語言和所有流行的書寫腳本,包括混合語言的文本。

  • 擴展拉丁字母:克羅地亞語、捷克語、丹麥語、荷蘭語、英語、愛沙尼亞語、芬蘭語、法語、德語、意大利語、拉脫維亞語、立陶宛語、挪威語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、西班牙語、瑞典語。
  • 西里爾字母:白俄羅斯語、保加利亞語、哈薩克語、俄語、塞爾維亞語、烏克蘭語。
  • 中文:6000多個字符。

您可以將語言檢測留給庫或自己定義語言以提高識別性能和可靠性。

識別照片

OCR 應用程序的最大障礙是掃描儀對於最終用戶來說並不常見。該 API 具有強大的內置圖像預處理過濾器,可以處理旋轉、傾斜和嘈雜的圖像。結合對所有圖像格式的支持,它甚至可以可靠地識別智能手機照片。大多數預處理和圖像校正都是自動完成的,因此您只需要在困難的情況下進行干預。

應用自動圖像校正 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 啟用自動偏斜計算和對比
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// 識別圖像
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

通用轉換器

該 API 幾乎可以讀取您可以從掃描儀、相機或智能手機獲取的任何圖像:PDF 文檔、JPEG、PNG、TIFF、GIF、BMP 圖像,甚至 DjVu 文件。完全支持多頁 PDF 文檔、TIFF 和 DjVu 圖像。您還可以通過 URL 提供來自網絡的圖像。

識別結果以最流行的文檔和數據交換格式返回:純文本、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。

識別 PDF 並將結果保存到 JSON - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 從掃描的 PDF 中識別所有頁面
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// 將每個頁面輸出為 JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

資源優化

光學字符識別是一個資源密集型過程。 API 提供了非常靈活的方法來在經典的時間-價格-質量三元組中取得平衡:

  • 在徹底識別和快速識別之間進行選擇。
  • 指定為識別分配的線程數,或允許庫自動縮放到處理器內核數。
  • 通過將計算卸載到 GPU 來釋放 CPU。

快速識別 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 以最快的模式識別圖像
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

拼寫檢查

雖然 OCR 產生可靠的結果,但灰塵和打印缺陷可能會導致某些符號被錯誤識別。 OCR API 有一個內置的拼寫檢查器,可以自動替換拼寫錯誤的單詞,讓您不必手動更正識別結果。

拼寫檢查識別結果 - C#

// 初始化 OCR 引擎
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// 啟用自動對比
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// 識別圖像
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// 糾正拼寫錯誤的單詞
string text =  result.GetSpellCheckCorrectedText();

批量處理

OCR API 通過提供各種允許您在一次調用中識別多張圖像的批處理方法,讓您從一張一張地識別每張圖像中解放出來:

  • 識別多頁 PDF、TIFF 和 DjVu 文件。
  • 識別文件夾中的所有文件。
  • 識別檔案中的所有文件。
  • 識別列表中的所有文件。

以身作則

Aspose.OCR for .NET 附帶了許多用 C# 編寫的示例,可讓您快速熟悉其功能和能力,並讓您了解為您的業務需求創建解決方案的想法。

  

Support and Learning Resources

  
  

Aspose 還為其他流行的編程語言提供原生 OCR API: