透過 Java 使用 Python 掌握圖像到文字轉換
使用 Python 識別圖像中的文本
更多展示 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
為什麼透過 Java 實作 Aspose.OCR for Python?
Aspose.OCR for Python via Java 將強大的光學字元辨識 (OCR) 功能無縫整合到您的跨平台 Python 筆記型電腦和應用程式中。借助我們直觀且高速的 API,您可以輕鬆地從掃描、螢幕截圖、網路連結或智慧型手機照片中提取文本,提供可用於整合、分析或儲存的結果。識別掃描的圖像、智慧型手機照片、螢幕截圖和掃描的 PDF,並將結果儲存為流行的文件格式。進階預處理濾鏡可處理旋轉、傾斜和雜訊影像。透過將任務卸載到 GPU 來優化效能。
快速且準確的 OCR
使用我們先進的 Python 透過 Java 技術實現高速、準確的 OCR 結果。
多語言支援
識別 130 多種語言的文本,包括拉丁語、西里爾語、阿拉伯語、波斯語、印度語和中文腳本,確保透過 Java 實現 Python 應用程式的多功能性。
靈活的影像支持
透過 Java 使用 Python 無縫處理來自掃描器、相機和智慧型手機的影像。
漢字辨識精準度
透過 Java 在 Python 專案中精確識別 6,000 多個漢字。
保留字體樣式和格式
維護字體樣式和格式,以便透過 Java 在 Python 應用程式中準確表示已識別的文字。
即時程式碼範例
只需三行程式碼即可啟動圖像文字辨識。體驗簡單!
將圖像轉換為文字
更多範例 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
選擇您的偏好
選擇適合您需求的庫。探索可用的 API 及其功能,以選擇最有效的解決方案。
多功能性
Python via .NET
均勻度
Python via Java
表現
Python via C++
Java 後端相容性
我們的程式庫設計為Python 模組,可確保支援 Java 的主要作業系統的兼容性- 包括Microsoft Windows、Linux 和macOS,或雲端平台。這使您能夠在一個平台上開發應用程式並在另一個平台上無縫運行它們,無需修改任何程式碼。
支援的文件格式
Aspose.OCR for Python via Java 幾乎可以處理任何 文件 您可以透過掃描器或相機取得。識別結果以最受歡迎的文件和資料交換格式傳回,可以儲存、匯入資料庫或即時分析。
圖片
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
批量OCR
- Multi-page PDF
- ZIP
- Folder
識別結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
適用於 Python 應用程式的強大 OCR
我們的庫可以輕鬆集成,使 Python 應用程式能夠在任何平台上無縫運行 - 桌面 Windows、Windows Server、macOS、Linux 和雲端。
130+ 識別語言
我們的 Python 和 Java OCR API 可識別多種語言和流行的書寫腳本,包括混合語言:
將語言偵測留給程式庫或您自己定義語言,以增強識別效能和可靠性。
- 擴展拉丁字母:英語、西班牙語、法語、印尼語、葡萄牙語、德語、越南語、土耳其語、義大利語、波蘭語等 80 多種;
- 西里爾語字母:俄語、烏克蘭語、哈薩克語、塞爾維亞語、白俄羅斯語、保加利亞語;
- 阿拉伯語、波斯語、烏爾都語;
- 中文和梵文文字,包括印地語、馬拉地語、博傑普爾語等。
增強型影像處理濾鏡
光學字元辨識的精確度在很大程度上依賴於原始影像的品質。 Aspose.OCR for Python via Java 提供了一系列自動和手動映像處理過濾器,可在提交到 OCR 引擎之前優化映像:
- 自動拉直稍微傾斜的影像。
- 手動校正嚴重傾斜影像的旋轉。
- 自動去除污垢、斑點、刮痕、眩光、不必要的漸層和其他類型的噪音。
- 自動調整影像對比度。
- 自動放大或手動調整影像大小。
- 將影像轉換為黑白或灰階。
- 反轉影像顏色,使亮區域顯得暗,暗區域顯得亮。
- 增加影像中字元的粗細。
- 模糊雜訊影像,同時保留字母邊緣。
- 拉直頁面傾斜並修正頁面照片中的相機鏡頭失真。
適用於各種文件類型的專用 API
Aspose.OCR for Python via Java 提供經過專門訓練的神經網絡,可以以最高的精度從某些類型的圖像中提取文字:
- 掃描或拍照的身份證和護照。
- 行車執照.
- 發票。
- 收據。
內建拼字檢查器
雖然 Aspose.OCR for Python via Java 提供了很高的辨識精度,但列印缺陷、污垢或非標準字體可能會導致某些字元或單字被錯誤辨識。為了進一步提高識別結果,您可以打開拼字檢查器,它會根據所選的識別語言尋找並自動修正拼字錯誤。
如果辨識的文字包含專業術語、縮寫詞以及其他常見拼字字典中不存在的單字,您可以提供自己的單字清單。
高效率批量識別
我們的 Python OCR API 可讓您簡化影像辨識。利用通用的批次方法在一次呼叫中高效處理多個影像:
- 識別多頁 PDF、TIFF 檔案。
- 處理資料夾內的所有檔案。
- 處理存檔中所有文件的識別。
- 識別指定清單中的圖像。
透過Python範例學習
探索各種 Python 範例 ,旨在協助您快速掌握我們的 OCR 解決方案的功能和功能。快速深入了解創建滿足您特定業務需求的客製化解決方案。
特性和功能
Aspose.OCR for Python via Java 探索 Aspose.OCR for Python 的進階功能
照片識別
以掃描級精度從智慧型手機照片中提取文字。
可搜尋的 PDF
將任何掃描結果轉換為完全可搜尋和可索引的文件。
網址識別
從 URL 識別圖像,無需下載到本機。
大量識別
讀取多頁文件、資料夾和檔案中的所有影像。
任何字體和样式
識別並識別所有流行字體和样式的文字。
微調識別
調整每個 OCR 參數以獲得最佳識別結果。
拼字檢查器
透過自動更正拼字錯誤的單字來提高結果。
尋找圖像中的文本
在一組圖像中搜尋文字或正規表示式。
比較圖像文本
比較兩個圖像上的文本,無論大小寫和佈局如何。
Python 程式碼範例
發現程式碼範例,透過 Java 將 Aspose.OCR for Python 無縫整合到您的應用程式中。
輕鬆安裝
作為 Python 套件或具有最小依賴性的可下載文件,Aspose.OCR for Python via Java 確保輕鬆分發。直接從Python 將其整合到您的專案中,您可以利用完整的OCR 功能,以各種格式儲存識別結果。 ,儘管有一定的限制。臨時許可證可消除 30 天內的所有試用版限制。利用這段時間開始開發功能齊全的 OCR 應用程序,以便您稍後做出明智的決定是否透過 Java 購買 Aspose.OCR for Python。
載入許可證
lic = License()
lic.set_license(self.licPath)
影像辨識
OCR 應用的主要挑戰是最終用戶缺乏掃描器。我們的 API 透過 Java 與 Python 無縫集成,具有強大的內建影像預處理過濾器,可處理旋轉、傾斜和雜訊影像。結合對所有圖像格式的支持,即使是智慧型手機照片,它也能實現可靠的識別。大多數預處理和影像校正都是自動化的,僅在具有挑戰性的情況下才需要您的介入。
應用自動影像校正 - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python 通用轉換器
我們的 API 能夠熟練地讀取來自掃描器、相機或智慧型手機的任何影像:PDF 文件、JPEG、PNG、TIFF、GIF、BMP 檔案。對多頁 PDF 文件、TIFF 和 DjVu 影像的全面支援確保了多功能性。您也可以透過 URL 提供來自網路的圖像。
識別結果以流行的文件和資料交換格式傳回:純文字、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。
識別 PDF 並將結果儲存為各種輸出格式 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
優化資源使用
OCR 提供了一種特殊的識別演算法,用於從具有稀疏文字和雜訊/彩色背景的影像中提取內容。此方法在以下業務場景中顯著提高 OCR 準確率:
- 閱讀街頭照片中的文字。
- 分割並辨識街道影像中的路標和招牌。
- 找到價格標籤並將提取的文字解釋為價格。
- 尋找並彙總食品標籤上感興趣的區域,例如營養資訊或成分清單。
- 辨識和分析汽車牌照。
- 從選單和目錄中提取文字。
開放區域 OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
從街道照片中提取文本
Python 的 OCR 提供了一種特殊的識別演算法,可以從車牌中提取文本,包括黑暗和模糊的照片。然後,產生的文字可以自動儲存到資料庫或自動驗證。
辨識車牌號碼-Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)