透過 C++ 實現 Python 的 Aspose.OCR 卓越 OCR
使用 Python OCR 進行圖像到文字識別
更多展示 >import asposeocr
settings = asposeocr.RecognitionSettings()
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = AsposeOCRRecognize(input_data, settings)
> pip install aspose-ocr-python-cpp
為什麼選擇 Aspose.OCR for Python via C++?
透過 C++ 使用 Aspose.OCR for Python 增強您的 OCR 功能。這個功能豐富的程式庫可以使用最少的程式碼將 OCR 無縫整合到 Python 應用程式中。體驗卓越的速度和準確性,支援 130 多種語言,包括拉丁語、西里爾語、阿拉伯語、波斯語、印度語和中文腳本。識別各種影像,從掃描文件和智慧型手機照片到螢幕截圖和掃描 PDF。先進的預處理濾鏡可應對旋轉、傾斜和雜訊影像等挑戰,透過利用 GPU 處理確保最佳效能。
快速、準確的 OCR
透過 C++ 技術,使用先進的 Python 實現快速、準確的 OCR 結果。
多語言識別
識別 130 多種語言的文本,透過 C++ 整合確保 Python 應用程式的多功能性。
全面的圖像支持
透過 C++ 使用 Python 輕鬆處理來自掃描器、相機和智慧型手機的影像。
準確的漢字識別
透過 C++ 精確辨識 Python 專案中的 6000 多個漢字。
維護字體樣式和格式
保留字體樣式和格式,以便透過 C++ 在 Python 應用程式中準確表示已識別的文字。
即時程式碼範例
只需三行程式碼即可啟動圖像文字辨識。體驗簡單!
將圖像轉換為文字
更多範例 >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);
選擇您的偏好
選擇適合您需求的庫。探索可用的 API 及其功能,以選擇最有效的解決方案。
多功能性
Python via .NET
均勻度
Python via Java
表現
Python via C++
Python 應用程式的 OCR 集成
Aspose.OCR for Python via C++ 與任何支援 C++ 的平台無縫整合- 無論是桌面Windows、Windows Server、macOS 、Linux ,或雲。
支援的文件格式
Aspose.OCR for Python via C++ 幾乎可以處理任何 文件 您可以透過掃描器或相機取得。識別結果以最受歡迎的文件和資料交換格式傳回,可以儲存、匯入資料庫或即時分析。
圖片
- JPEG
- PNG
- TIFF
- BMP
批量OCR
- Multi-page PDF
- ZIP
- Folder
識別結果
- Text
- Microsoft Word
- Microsoft Excel
- RTF
- JSON
- XML
Python 應用程式的 C++ 後端集成
我們的程式庫與 C++ 後端無縫集成,使 Python 應用程式能夠在任何平台上無縫運行 - 桌面 Windows、Windows Server、macOS、Linux 和雲端。
130+ 識別語言
支援多種語言和腳本,包括混合語言:
透過讓庫檢測語言或定義語言來優化識別以提高效能。
- 擴展拉丁字母:英語、西班牙語、法語、印尼語、葡萄牙語、德語、越南語、土耳其語、義大利語、波蘭語等 80 多種;
- 西里爾語字母:俄語、烏克蘭語、哈薩克語、塞爾維亞語、白俄羅斯語、保加利亞語;
- 阿拉伯語、波斯語、烏爾都語;
- 中文和梵文文字,包括印地語、馬拉地語、博傑普爾語等。
主要特徵
Aspose.OCR for Python via C++ 透過 C++ 探索 Aspose.OCR for Python 的進階功能。
照片識別
以掃描級精度從智慧型手機照片中提取文字。
可搜尋的 PDF
將任何掃描結果轉換為完全可搜尋和可索引的文件。
網址識別
從 URL 識別圖像,無需下載到本機。
大量識別
讀取多頁文件、資料夾和檔案中的所有影像。
任何字體和样式
識別並識別所有流行字體和样式的文字。
微調識別
調整每個 OCR 參數以獲得最佳識別結果。
拼字檢查器
透過自動更正拼字錯誤的單字來提高結果。
尋找圖像中的文本
在一組圖像中搜尋文字或正規表示式。
比較圖像文本
比較兩個圖像上的文本,無論大小寫和佈局如何。
限制識別範圍
限制 OCR 引擎將尋找的字元集。
檢測影像缺陷
自動尋找影像中可能有問題的區域。
識別區域
僅查找和讀取圖像的特定區域,而不是所有文字。
Python 程式碼範例
發現程式碼範例,透過 C++ 將 Aspose.OCR for Python 無縫整合到您的應用程式中。
輕鬆安裝
文檔區域偵測
文字文件的圖像掃描或照片通常包含多個內容區塊,包括文字段落、表格、插圖、公式等。成功、準確地識別頁面上的這些感興趣區域對於有效的 OCR 至關重要。這個關鍵過程稱為文件區域檢測,涉及不同內容區域的識別、組織和分類。Aspose.OCR 提供了多種文件區域偵測演算法,可讓您選擇最適合您的特定內容的一種。
各種圖片內容的設定 - Python OCR
settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE
input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)
多種輸出格式
C++ 的 OCR 可以以多種格式儲存識別結果,以便可以共用、儲存在資料庫中、顯示或分析:純文字、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。 {index-content-python-cpp.code_samples.item3.content2}
將識別結果儲存為 JSON - Python
recognize_result_txt
= asposeocr.AsposeOCRSerializeResult(
recognize_result,
asposeocr.ExportFormat.json)