為什麼選擇Aspose OCR庫作為Java?

使用Aspose OCR Java庫解鎖強大的OCR。我們的Java API是一種有效,用戶友好且具有成本效益的OCR API。在僅五行Java代碼中,在您的應用程序中添加功能強大的OCR功能而無需了解神經網絡和其他技術細節。

我們的OCR引擎提供了無與倫比的速度和準確性,支持140多種語言,包括英語,西里爾,西拉米克語,阿拉伯語,中國,日本,韓國,韓國,印地語,tami,Tamil和更多語言。無論您是使用掃描,智能手機照片,屏幕截圖還是PDF,我們的OCR提取物,都以所有流行格式生成結果。
圖像預處理預處理自動糾正旋轉,模糊,倒置和嘈雜的圖像,以確保在任何條件下最高識別精度。

Illustration ocr

迅速而精確的OCR

通過我們的先進Java技術,獲得高速且準確的OCR結果。

多語言支持

識別140多種語言的文字,包括英語,法語,西里爾語,阿拉伯語,波斯語,指示,中文,日語,韓語,泰米爾語和其他劇本。

所有圖像

從各種來源(例如掃描儀,相機和智能手機)處理圖像。

混合語言檢測

識別用混合語言編寫的文檔,例如中文/英語,阿拉伯語/法語,印地語/英語和西里爾/英語。

任何字體,樣式和格式

準確地保留文本佈局,檢測表結構,並無縫識別文本,而不管字體樣式如何。

實時代碼樣本

體驗簡單性:將圖像轉換為文本中的幾行Java代碼

準備識別 準備識別 在此處放置文件或單擊瀏覽 *

*通過上傳文件或使用您同意我們的服務 使用條款隱私政策.

識別結果
 

將圖像轉換為文字

探索更多示例 >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

跨平台

Aspose Java OCR代碼在支持[Java SE 6.0或更高版本]的任何平台上無縫操作(https://docs.aspose.com/ocr/java/java/system-requirements/) - 是本地機器,Web服務器或云。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for Java 可以使用任何 文件 您可以從掃描儀或相機中獲得。識別結果可以保存,導入到數據庫或實時分析。

圖像

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

批量OCR

  • Multi-page PDF
  • ZIP
  • Folder

識別結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

易於安裝

aspose.ocr for Java被分配為輕量級Java存檔(JAR)文件或[可下載文件](https://releases.aspose.com/ocr/java/),具有最小的依賴關係。只需[install](https://docs.aspose.com/ocr/java/installation/)它進入您的項目,您都將以多種支持語言識別文本並以各種格式識別識別結果。

[請求試用許可證](https://purchase.aspose.com/temporary-license),以啟動無限制的功能性OCR應用程序的開發。

到處都可以工作

我們的Java庫完全支持Java SE 6或更高版本,使您的應用程序能夠在任何平台上無縫運行 - 桌面Windows,Windows Server,Macos,Linux和The Cloud。

140多種識別語言

我們的Java OCR庫是在全球範圍內用於文檔處理,數據提取和內容數字化的通用解決方案。為了支持各種歐洲,中東和亞洲寫作腳本,它適合任何國家和商業。

Java的Aspose OCR在多語言文檔中識別文本,例如中文/英語,阿拉伯語/法語或西里爾/英語。支持以下語言:

  • 擴展拉丁語:英語,西班牙語,法語,印尼,葡萄牙語,德國,越南語,土耳其語,意大利語,波蘭語和80歲以上;
  • 西里爾字母:俄羅斯,烏克蘭,哈薩克,保加利亞人,包括混合的西里爾/英語文本;
  • 阿拉伯語,波斯語,烏爾都語,包括與英語混合的文字;
  • 中文,韓國,日本,德文納加里和德拉維語,包括印地語,泰米爾語,馬拉地語等。

功能和功能

Aspose.OCR for Java 探索Java Aspose OCR的高級功能和功能。

Feature icon

照片OCR

從智能手機照片中提取文字,具有掃描級別的精度。

Feature icon

可搜索的PDF

將任何掃描轉換為可搜索且可編輯的文檔。

Feature icon

URL識別

識別來自URL的圖像而無需在本地下載。

Feature icon

散裝認可

閱讀來自多頁文檔,文件夾和檔案的所有圖像。

Feature icon

任何字體和样式

識別並識別所有流行字體和样式中的文本。

Feature icon

微調識別

調整每個OCR參數以獲得最佳識別結果。

Feature icon

拼寫檢查器

通過自動糾正拼寫錯誤的單詞來改善結果。

Feature icon

在圖像中找到文字

在一組圖像中搜索文本或正則表達式。

Feature icon

比較圖像文本

無論情況和佈局如何,都比較兩個圖像上的文本。

Feature icon

全世界

用自動語言檢測提取任何語言的文本。

Feature icon

關鍵細節提取

自動從身份證中提取重要細節。

Feature icon

與Aspose解決方案完全集成

將OCR與其他Aspose產品無縫集成,以實現全面有效的Java解決方案。

代碼樣本

探索代碼示例,以了解如何將OCR API無縫集成到Java應用程序中。

安裝

作為具有最小依賴關係或Maven存儲庫的Java存檔(JAR)文件,很容易分發Java的Aspose OCR。直接從您首選的Java集成開發環境(IDE)中集成到您的項目中,是一個無縫的過程。只需安裝它,就準備好利用OCR功能的完整範圍,以任何受支持的格式保存識別結果。

後安裝後,您可以立即開始使用aspose.omr for Java,儘管有某些限制。臨時許可將使所有試用版本限制30天。利用此期間啟動功能齊全的OCR應用程序的開發,使您可以在以後的階段做出明智的購買aspose.ocr.ocr。

識別Java中掃描圖像的文字

克服缺乏廣泛掃描儀的OCR應用的挑戰。我們的API擁有功能強大的內置圖像預處理過濾器,這些過濾器巧妙地處理旋轉,偏斜和嘈雜的圖像。結合對所有圖像格式的支持,它即使在智能手機照片中也可以確保可靠的識別。大多數預處理和圖像校正都是自動化的,只需要在具有挑戰性的情況下進行干預。

應用自動圖像更正-Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

從Java中的照片中提取文字

在Java應用程序中整合文本檢測和識別。訪問精確的照片可以輕鬆地從照片中獲得,從而增強了您的圖像處理功能。提升圖像處理功能,從照片中獲得準確的結果。

在照片上檢測並識別文本-Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java中的資源優化

光學特徵識別需要資源。我們的API提供了平衡經典時間價格質量三合會的靈活方法。它允許您限制識別引擎使用的線程數。儘管此調整可能會導致識別速度較慢,但它使您可以為並發任務分配資源,例如並行圖像處理,Web服務器操作,數據庫管理或背景數據分析。

  • 在透徹識別和快速識別之間進行選擇。
  • 指定分配識別的線程數,或允許庫自動擴展到處理器內核的數量。
  • 通過將計算釋放到GPU來釋放CPU。

平衡資源

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

用最少的設置快速識別

如果您的圖像是高質量的掃描而沒有偏斜或失真,則可以使用最快的識別模式,該模式使用以下方式消耗最低可能的資源:

快速識別OCR -Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});