Aspose.OCR  for Java

在 Java 中將圖像和 PDF 轉換為文本

使用光學字符識別 (OCR) 功能輕鬆創建跨平台 Java 應用程序。

  Download Free Trial
  
 

Aspose.OCR for Java 允許您從圖像、屏幕截圖、圖像的特定區域提取文本,並從支持 Java 的任何平台上的掃描文件創建可搜索的 PDF。憑藉其強大且易於使用的 API,即使是複雜的 OCR 任務也只需不到 10 行代碼。您無需使用公式和機器學習 - 該庫將處理所有技術細節,並根據拉丁文西里爾字母以及中文26種語言生成可靠的結果。 OCR API 處理掃描的圖像、智能手機照片、屏幕截圖、圖像區域和掃描的 PDF,並以最流行的文檔格式返回結果。通過跨多個 CPU 內核分配計算並將資源密集型任務卸載到GPU可以進一步提高識別速度、準確性和性能。

Aspose.OCR for Java 的特性和功能

識別掃描圖像和 PDF 中的格式化文本

支持您可以從掃描儀或相機獲得的所有文件格式

閱讀拉丁文和西里爾文腳本

識別6000多個漢字

檢測並識別所有流行的字體

仔細保留字體樣式和格式

僅處理整個圖像或選定區域

支持旋轉、傾斜和嘈雜的圖像

批量識別文件夾或存檔中的所有圖像

識別作為 Web 鏈接提供的圖像

查找並自動更正拼寫錯誤的單詞

與其他 Aspose 產品 100% 兼容

易於安裝

您可以按照簡單的安裝說明直接從基於Maven的項目中使用 Aspose.OCR for Java。

申請臨時許可證以開始構建功能齊全的 OCR 應用程序,不受任何限制。

$Easy to Use$

圖像識別需要幾行代碼。字面上地。這真的很簡單 - 試試自己:

7行圖像到文本 - Java

// 創建 OCR API 實例
AsposeOCR api = new AsposeOCR();

try {
    // 識別圖像
    String result = api.RecognizePage(imagePath);
    // 顯示識別結果
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // 錯誤處理
    e.printStackTrace();
}

26種識別語言

OCR API 支持大量語言和所有流行的書寫腳本,包括混合語言的文本。內置拼寫檢查器自動替換拼寫錯誤的單詞,省去您手動更正識別結果的麻煩。

  • 擴展拉丁字母:克羅地亞語、捷克語、丹麥語、荷蘭語、英語、愛沙尼亞語、芬蘭語、法語、德語、意大利語、拉脫維亞語、立陶宛語、挪威語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、西班牙語、瑞典語。
  • 西里爾字母:白俄羅斯語、保加利亞語、哈薩克語、俄語、塞爾維亞語、烏克蘭語。
  • 中文:6000多個字符。

您可以指定語言以提高識別性能和可靠性,或讓 API 自動檢測語言。

保留格式

OCR API 以常規、粗體和斜體樣式讀取所有流行的字體,例如 Arial、Times New Roman、Courier New、Tahoma、Calibri 等,並仔細保留 OCR 結果中的格式。您還可以將識別結果拆分為行並檢測頁面中的文本區域。

識別照片

掃描儀在最終用戶工作站上並不總是可用,這可能成為 OCR 應用程序的阻礙。我們的 OCR API 提供了許多預處理過濾器,可以處理扭曲、旋轉、傾斜和嘈雜的圖像。結合對所有圖像格式的支持,它甚至可以可靠地識別智能手機照片。大多數預處理和圖像校正都是自動完成的,但您始終可以在困難的情況下進行干預。

應用圖像校正 - Java

// 創建 OCR API 實例
AsposeOCR api = new AsposeOCR();

// 定義預處理過濾器
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// 識別前預處理圖像
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// 識別圖像
RecognitionResult result = api.RecognizePage(imageRes, set);

性能優化

光學字符識別需要大量的處理資源,這可能成為 Web 服務和入門級設備的問題。 API 提供了非常靈活的方法來平衡識別速度、資源要求和準確性:

  • 在徹底識別和快速識別之間進行選擇。
  • 指定為識別分配的線程數,或允許庫自動縮放到 CPU 內核數。
  • 通過將計算卸載到 GPU 來釋放 CPU。

快速識別 - Java

// 創建 OCR API 實例
AsposeOCR api = new AsposeOCR();

// 以最快的模式識別圖像
String result = api.RecognizePageFast("sample.jpg");

批量處理

OCR API 通過提供各種允許您在一次調用中識別多個圖像的批處理方法,使您不必一次識別每個圖像:

  • 識別多頁 PDF 和 TIFF 文件。
  • 識別存檔中的所有文件。
  • 識別文件夾中的所有文件。
  

Support and Learning Resources

  
  

Aspose 還為其他流行的編程語言提供原生 OCR API: