為什麼選擇 Java 版 Aspose OCR 函式庫?

使用 Aspose OCR Java 函式庫解鎖強大的 OCR。我們的 Java API 是一種高效能、用戶友好且經濟高效的 OCR API。只需五行Java 程式碼,即可為您的應用程式添加強大的OCR 功能,而無需了解神經網路和其他技術細節。 130 多種語言,包括英語、西里爾語、阿拉伯語、波斯語、中文、日語、韓語、印地語、泰米爾語等等。無論您使用掃描件、智慧型手機照片、螢幕截圖還是PDF,我們的OCR 都會提取文字並產生所有流行格式的結果。在以下情況下獲得最高的識別精度:任何條件。

Illustration ocr

快速、準確的 OCR

利用我們先進的 Java 技術實現高速、準確的 OCR 結果。

多語言支援

識別 140 多種語言的文本,包括英語、法語、西里爾語、阿拉伯語、波斯語、印度語、中文、日語、韓語、泰米爾語和其他文字。

所有圖片

處理來自各種來源的影像,例如掃描器、相機和智慧型手機。

混合語言偵測

識別以混合語言編寫的文檔,例如中文/英文、阿拉伯文/法文、印地文/英文和西里爾文/英文。

任何字體、樣式和格式

準確保留文字佈局、檢測表格結構並無縫識別文本,無論字體樣式如何。

即時程式碼範例

體驗簡單性:只需幾行 Java 程式碼即可將圖像轉換為文字

準備好識別 準備好識別 將檔案拖曳到此處或按一下瀏覽*

* 透過上傳您的文件或使用我們的服務,您同意我們的 使用條款隱私權政策.

識別結果
 

將圖像轉換為文字

探索更多範例 >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

跨平台

Aspose Java OCR 程式碼可在任何支援 Java SE 6.0 或更高版本 的平台上無縫運作– 無論是本機、Web伺服器還是雲端。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支援的文件格式

Aspose.OCR for Java 可以處理任何 文件 您可以透過掃描器或相機取得。識別結果可以儲存、匯入資料庫或即時分析。

圖片

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

批量OCR

  • Multi-page PDF
  • ZIP
  • Folder

識別結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

安裝方便

Aspose.OCR for Java 作為輕量級 Java 檔案 (JAR) 檔案或具有最小依賴性的 可下載檔案 分發。只需將其 安裝 到您的專案中,您就可以識別多種支援語言的文字並以各種格式儲存識別結果。

請求試用許可證 以無限制地開始開發功能齊全的 OCR 應用程式。

隨處可用

我們的 Java 程式庫完全支援 Java SE 6 或更高版本,讓您的應用程式能夠在任何平台上無縫運行 - 桌面 Windows、Windows Server、macOS、Linux 和雲端。

140+ 識別語言

我們的 Java OCR 庫是全球範圍內文件處理、資料提取和內容數位化的通用解決方案。它支援大量歐洲、中東和亞洲書寫腳本,非常適合任何國家和企業。

Aspose OCR for Java 可辨識多語言文件中的文本,例如中文/英文、阿拉伯文/法文或西里爾/英文。支援以下語言:

  • 擴展拉丁語:英語、西班牙語、法語、印尼語、葡萄牙語、德語、越南語、土耳其語、義大利語、波蘭語等 80 多種;
  • 西里爾文字母:俄語、烏克蘭語、哈薩克語、保加利亞語,包括混合西里爾語/英語文本;
  • 阿拉伯語、波斯語、烏爾都語,包括與英語混合的文本;
  • 中文、韓語、日語、梵文和德拉威語,包括印地語、泰米爾語、馬拉地語等。

特性和功能

Aspose.OCR for Java 探索 Aspose OCR for Java 的高階特性和功能。

Feature icon

照片識別

以掃描級精度從智慧型手機照片中提取文字。

Feature icon

可搜尋的 PDF

將任何掃描件轉換為可搜尋和可編輯的文件。

Feature icon

網址識別

從 URL 識別圖像,無需下載到本機。

Feature icon

大量識別

讀取多頁文件、資料夾和檔案中的所有影像。

Feature icon

任何字體和样式

識別並識別所有流行字體和样式的文字。

Feature icon

微調識別

調整每個 OCR 參數以獲得最佳識別結果。

Feature icon

拼字檢查器

透過自動更正拼字錯誤的單字來提高結果。

Feature icon

尋找圖像中的文本

在一組圖像中搜尋文字或正規表示式。

Feature icon

比較圖像文本

比較兩個圖像上的文本,無論大小寫和佈局如何。

Feature icon

全世界

透過自動語言偵測提取任何語言的文字。

Feature icon

關鍵細節提取

自動從身分證中提取重要詳細資訊。

Feature icon

與 Aspose 解決方案完全集成

將 OCR 與其他 Aspose 產品無縫集成,以獲得全面、高效的 Java 解決方案。

程式碼範例

探索程式碼範例,了解如何將 OCR API 無縫整合到您的 Java 應用程式中。

安裝

作為具有最小依賴性或來自 Maven 存儲庫的 Java 存檔 (JAR) 文件,Aspose OCR for Java 很容易分發。直接從您首選的 Java 整合開發環境 (IDE) 整合到您的專案中是一個無縫過程。只需安裝它,您就可以利用完整的 OCR 功能,以任何支援的格式儲存識別結果。 。臨時許可證可解除 30 天內的所有試用版限制。利用這段時間開始開發功能齊全的 OCR 應用程序,以便您在稍後階段做出購買 Aspose.OCR for Java 的明智決定。

使用 Java 識別掃描圖像上的文本

克服 OCR 應用程式缺乏廣泛掃描器的挑戰。我們的 API 擁有強大的內建影像預處理過濾器,可熟練處理旋轉、傾斜和雜訊影像。結合對所有圖像格式的支持,即使是智慧型手機照片也能確保可靠的識別。大多數預處理和影像校正都是自動化的,僅在具有挑戰性的情況下才需要您的介入。

應用自動影像校正 - Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

用 Java 從照片中提取文本

將文字偵測和識別整合到您的 Java 應用程式中。輕鬆取得照片的精確結果,增強您的影像處理能力。提升影像處理能力,從照片中獲得準確的結果。

檢測並識別照片上的文字 - Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java 中的資源優化

光學字元辨識需要資源。我們的 API 提供了一種靈活的方法來平衡經典的時間-價格-品質三元組。它允許您限制識別引擎使用的線程數。雖然此調整可能會導致識別速度變慢,但它使您能夠為平行影像處理、Web 伺服器操作、資料庫管理或後台資料分析等並發任務指派資源。

  • 在徹底識別和快速識別之間進行選擇。
  • 指定分配用於識別的執行緒數,或允許庫自動縮放到處理器核心的數量。
  • 透過將計算卸載到 GPU 來釋放 CPU。

平衡資源使用

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

只需最少的設定即可快速識別

如果您的影像是高品質掃描件,沒有傾斜或失真,您可以使用最快的辨識模式,消耗盡可能少的資源:

快速識別 OCR - Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});