Aspose.OCR for Java 允許您從圖像、屏幕截圖、圖像的特定區域提取文本,並從支持 Java 的任何平台上的掃描文件創建可搜索的 PDF。憑藉其強大且易於使用的 API,即使是複雜的 OCR 任務也只需不到 10 行代碼。您無需使用公式和機器學習 - 該庫將處理所有技術細節,並根據拉丁文和西里爾字母以及中文以26種語言生成可靠的結果。 OCR API 處理掃描的圖像、智能手機照片、屏幕截圖、圖像區域和掃描的 PDF,並以最流行的文檔格式返回結果。通過跨多個 CPU 內核分配計算並將資源密集型任務卸載到GPU可以進一步提高識別速度、準確性和性能。
Aspose.OCR for Java 的特性和功能
識別掃描圖像和 PDF 中的格式化文本
支持您可以從掃描儀或相機獲得的所有文件格式
閱讀拉丁文和西里爾文腳本
識別6000多個漢字
檢測並識別所有流行的字體
仔細保留字體樣式和格式
僅處理整個圖像或選定區域
支持旋轉、傾斜和嘈雜的圖像
批量識別文件夾或存檔中的所有圖像
識別作為 Web 鏈接提供的圖像
查找並自動更正拼寫錯誤的單詞
與其他 Aspose 產品 100% 兼容
$Easy to Use$
圖像識別需要幾行代碼。字面上地。這真的很簡單 - 試試自己:
7行圖像到文本 - Java
// 創建 OCR API 實例
AsposeOCR api = new AsposeOCR();
try {
// 識別圖像
String result = api.RecognizePage(imagePath);
// 顯示識別結果
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// 錯誤處理
e.printStackTrace();
}
26種識別語言
OCR API 支持大量語言和所有流行的書寫腳本,包括混合語言的文本。內置拼寫檢查器自動替換拼寫錯誤的單詞,省去您手動更正識別結果的麻煩。
- 擴展拉丁字母:克羅地亞語、捷克語、丹麥語、荷蘭語、英語、愛沙尼亞語、芬蘭語、法語、德語、意大利語、拉脫維亞語、立陶宛語、挪威語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、西班牙語、瑞典語。
- 西里爾字母:白俄羅斯語、保加利亞語、哈薩克語、俄語、塞爾維亞語、烏克蘭語。
- 中文:6000多個字符。
您可以指定語言以提高識別性能和可靠性,或讓 API 自動檢測語言。
保留格式
OCR API 以常規、粗體和斜體樣式讀取所有流行的字體,例如 Arial、Times New Roman、Courier New、Tahoma、Calibri 等,並仔細保留 OCR 結果中的格式。您還可以將識別結果拆分為行並檢測頁面中的文本區域。
識別照片
掃描儀在最終用戶工作站上並不總是可用,這可能成為 OCR 應用程序的阻礙。我們的 OCR API 提供了許多預處理過濾器,可以處理扭曲、旋轉、傾斜和嘈雜的圖像。結合對所有圖像格式的支持,它甚至可以可靠地識別智能手機照片。大多數預處理和圖像校正都是自動完成的,但您始終可以在困難的情況下進行干預。
應用圖像校正 - Java
// 創建 OCR API 實例
AsposeOCR api = new AsposeOCR();
// 定義預處理過濾器
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// 識別前預處理圖像
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// 識別圖像
RecognitionResult result = api.RecognizePage(imageRes, set);
性能優化
光學字符識別需要大量的處理資源,這可能成為 Web 服務和入門級設備的問題。 API 提供了非常靈活的方法來平衡識別速度、資源要求和準確性:
- 在徹底識別和快速識別之間進行選擇。
- 指定為識別分配的線程數,或允許庫自動縮放到 CPU 內核數。
- 通過將計算卸載到 GPU 來釋放 CPU。
快速識別 - Java
// 創建 OCR API 實例
AsposeOCR api = new AsposeOCR();
// 以最快的模式識別圖像
String result = api.RecognizePageFast("sample.jpg");
批量處理
OCR API 通過提供各種允許您在一次調用中識別多個圖像的批處理方法,使您不必一次識別每個圖像:
- 識別多頁 PDF 和 TIFF 文件。
- 識別存檔中的所有文件。
- 識別文件夾中的所有文件。