使用 Java OCR API 將圖像轉為文字
在Java中將圖像轉換為文字
更多展示 >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
為什麼選擇 Java 版 Aspose OCR 函式庫?
使用 Aspose OCR Java 函式庫解鎖強大的 OCR。我們的 Java API 是一種高效能、用戶友好且經濟高效的 OCR API。只需五行Java 程式碼,即可為您的應用程式添加強大的OCR 功能,而無需了解神經網路和其他技術細節。 130 多種語言,包括英語、西里爾語、阿拉伯語、波斯語、中文、日語、韓語、印地語、泰米爾語等等。無論您使用掃描件、智慧型手機照片、螢幕截圖還是PDF,我們的OCR 都會提取文字並產生所有流行格式的結果。在以下情況下獲得最高的識別精度:任何條件。
快速、準確的 OCR
利用我們先進的 Java 技術實現高速、準確的 OCR 結果。
多語言支援
識別 140 多種語言的文本,包括英語、法語、西里爾語、阿拉伯語、波斯語、印度語、中文、日語、韓語、泰米爾語和其他文字。
所有圖片
處理來自各種來源的影像,例如掃描器、相機和智慧型手機。
混合語言偵測
識別以混合語言編寫的文檔,例如中文/英文、阿拉伯文/法文、印地文/英文和西里爾文/英文。
任何字體、樣式和格式
準確保留文字佈局、檢測表格結構並無縫識別文本,無論字體樣式如何。
即時程式碼範例
體驗簡單性:只需幾行 Java 程式碼即可將圖像轉換為文字
將圖像轉換為文字
探索更多範例 >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
跨平台
Aspose Java OCR 程式碼可在任何支援 Java SE 6.0 或更高版本 的平台上無縫運作– 無論是本機、Web伺服器還是雲端。
支援的文件格式
Aspose.OCR for Java 可以處理任何 文件 您可以透過掃描器或相機取得。識別結果可以儲存、匯入資料庫或即時分析。
圖片
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
批量OCR
- Multi-page PDF
- ZIP
- Folder
識別結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
隨處可用
我們的 Java 程式庫完全支援 Java SE 6 或更高版本,讓您的應用程式能夠在任何平台上無縫運行 - 桌面 Windows、Windows Server、macOS、Linux 和雲端。
140+ 識別語言
我們的 Java OCR 庫是全球範圍內文件處理、資料提取和內容數位化的通用解決方案。它支援大量歐洲、中東和亞洲書寫腳本,非常適合任何國家和企業。
Aspose OCR for Java 可辨識多語言文件中的文本,例如中文/英文、阿拉伯文/法文或西里爾/英文。支援以下語言:
- 擴展拉丁語:英語、西班牙語、法語、印尼語、葡萄牙語、德語、越南語、土耳其語、義大利語、波蘭語等 80 多種;
- 西里爾文字母:俄語、烏克蘭語、哈薩克語、保加利亞語,包括混合西里爾語/英語文本;
- 阿拉伯語、波斯語、烏爾都語,包括與英語混合的文本;
- 中文、韓語、日語、梵文和德拉威語,包括印地語、泰米爾語、馬拉地語等。
特性和功能
Aspose.OCR for Java 探索 Aspose OCR for Java 的高階特性和功能。
照片識別
以掃描級精度從智慧型手機照片中提取文字。
可搜尋的 PDF
將任何掃描件轉換為可搜尋和可編輯的文件。
網址識別
從 URL 識別圖像,無需下載到本機。
大量識別
讀取多頁文件、資料夾和檔案中的所有影像。
任何字體和样式
識別並識別所有流行字體和样式的文字。
微調識別
調整每個 OCR 參數以獲得最佳識別結果。
拼字檢查器
透過自動更正拼字錯誤的單字來提高結果。
尋找圖像中的文本
在一組圖像中搜尋文字或正規表示式。
比較圖像文本
比較兩個圖像上的文本,無論大小寫和佈局如何。
全世界
透過自動語言偵測提取任何語言的文字。
關鍵細節提取
自動從身分證中提取重要詳細資訊。
與 Aspose 解決方案完全集成
將 OCR 與其他 Aspose 產品無縫集成,以獲得全面、高效的 Java 解決方案。
程式碼範例
探索程式碼範例,了解如何將 OCR API 無縫整合到您的 Java 應用程式中。
安裝
使用 Java 識別掃描圖像上的文本
克服 OCR 應用程式缺乏廣泛掃描器的挑戰。我們的 API 擁有強大的內建影像預處理過濾器,可熟練處理旋轉、傾斜和雜訊影像。結合對所有圖像格式的支持,即使是智慧型手機照片也能確保可靠的識別。大多數預處理和影像校正都是自動化的,僅在具有挑戰性的情況下才需要您的介入。
應用自動影像校正 - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
用 Java 從照片中提取文本
將文字偵測和識別整合到您的 Java 應用程式中。輕鬆取得照片的精確結果,增強您的影像處理能力。提升影像處理能力,從照片中獲得準確的結果。
檢測並識別照片上的文字 - Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Java 中的資源優化
光學字元辨識需要資源。我們的 API 提供了一種靈活的方法來平衡經典的時間-價格-品質三元組。它允許您限制識別引擎使用的線程數。雖然此調整可能會導致識別速度變慢,但它使您能夠為平行影像處理、Web 伺服器操作、資料庫管理或後台資料分析等並發任務指派資源。
- 在徹底識別和快速識別之間進行選擇。
- 指定分配用於識別的執行緒數,或允許庫自動縮放到處理器核心的數量。
- 透過將計算卸載到 GPU 來釋放 CPU。
平衡資源使用
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
只需最少的設定即可快速識別
如果您的影像是高品質掃描件,沒有傾斜或失真,您可以使用最快的辨識模式,消耗盡可能少的資源:
快速識別 OCR - Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});