Python OCR 函式庫
使用 Python OCR 將圖像轉換為文字
更多展示 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
為什麼選擇 Aspose.OCR for Python via .NET?
透過 .NET 踏上 Aspose OCR for Python 之旅——多功能且用戶友好的 OCR API。只需不到 5 行程式碼即可將 OCR 功能嵌入到您的 Python 應用程式中,無需複雜的數學或神經網路。我們強大的 OCR 引擎提供無與倫比的速度和準確性,支援 130 多種語言,包括英語、西里爾語、阿拉伯語、波斯語、印地語、中文、日語、韓語、泰米爾語等。無論是掃描影像、智慧型手機照片、螢幕截圖或掃描 PDF,都能以流行的文件和資料交換格式獲得結果。利用預處理濾波器來處理旋轉、傾斜和雜訊影像。
高效能精準的OCR
透過先進的 Python 技術,體驗 OCR 結果無與倫比的速度和精確度。
多種語言
辨識 140 多種語言的文字:英語、法語、德語、西班牙語、俄語、中文、印地語、日語、韓語、泰米爾語、阿拉伯語、波斯語等。
普遍的
使用 Python 輕鬆處理來自不同來源(掃描器、相機和智慧型手機)的影像。
亞洲語言
實現中文、阿拉伯文、梵文和德拉威文字以及混合語言文本的精確識別。
保留佈局
維護來源格式以實現準確的文字表示並識別表格。
即時程式碼範例
只需三行 Python 程式碼即可將圖像轉換為文字。自己嘗試吧!
將圖像轉換為文字
發現更多範例 ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
選擇您的偏好
選擇適合您需求的庫。探索可用的 API 及其功能,以選擇最有效的解決方案。
多功能性
Python via .NET
均勻度
Python via Java
表現
Python via C++
到處跑
無論名稱為何,Aspose.OCR for Python via .NET 不需要在目標平台上安裝 .NET。安裝包已附帶所有必需的組件,並且可以在任何平台上無縫運行 - 無論是本機、Web 伺服器還是雲端。
支援的文件格式
Aspose.OCR for Python via .NET 可以處理任何 文件 您可以透過掃描器或相機取得。識別結果可以儲存、匯入資料庫或即時分析。
圖片
- JPEG
- PNG
- TIFF
- BMP
- GIF
批量OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
識別結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Python 下的 OCR
我們的庫可以輕鬆集成,使 Python 應用程式能夠在任何平台上無縫運行 - 桌面 Windows、Windows Server、macOS、Linux 和雲端。
140+ 識別語言
我們的 Java OCR 庫是全球範圍內文件處理、資料提取和內容數位化的通用解決方案。它支援大量歐洲、中東和亞洲書寫腳本,非常適合任何國家和企業。
Aspose OCR for Java 可辨識多語言文件中的文本,例如中文/英文、阿拉伯文/法文或西里爾/英文。支援以下語言:
- 擴展拉丁語:英語、西班牙語、法語、印尼語、葡萄牙語、德語、越南語、土耳其語、義大利語、波蘭語等 80 多種;
- 西里爾文字母:俄語、烏克蘭語、哈薩克語、保加利亞語,包括混合西里爾語/英語文本;
- 阿拉伯語、波斯語、烏爾都語,包括與英語混合的文本;
- 中文、韓語、日語、梵文和德拉威語,包括印地語、泰米爾語、馬拉地語等。也支援混合語言文字。
強大的處理過濾器
光學字元辨識的準確性和可靠性很大程度上取決於原始影像的品質。 Aspose OCR for Python via .NET 提供大量全自動和手動影像處理濾鏡,可在將影像傳送至 OCR 引擎之前進行增強:
- 自動旋轉顛倒和旋轉影像。
- 偵測倒置影像並擷取黑底白字。
- 自動去除污垢、斑點、刮痕、眩光、不必要的漸層和其他噪音。
- 自動調整影像對比度。
- 自動放大或手動調整影像大小。
- 將影像轉換為黑白或灰階。
- 尋找影像中潛在問題的區域並傳回有關缺陷類型及其座標的資訊。
- 增加影像中字元的粗細。
- 模糊吵雜的影像,同時保留字母的邊緣。
- 拉直頁面曲率並修復頁面照片的相機鏡頭失真。
針對特定文檔類型進行了最佳化
Aspose OCR for Python via .NET 提供經過專門訓練的神經網絡,可以以最高的準確度從某些類型的圖像中提取文字:
內建拼字檢查器
雖然我們的Python OCR庫提供了很高的辨識精度,但列印缺陷、污垢或非標準字體可能會導致某些字元或單字被錯誤辨識。為了進一步提高識別結果,您可以打開拼字檢查器,它會根據所選的識別語言尋找並自動修正拼字錯誤。
如果辨識的文字包含專業術語、縮寫詞以及其他常見拼字字典中不存在的單字,您可以提供自己的單字清單。
大量識別
我們的 Python OCR API 將您從一張一張識別圖像中解放出來。採用各種批次方法在一次呼叫中辨識多個影像:
- 識別多頁 PDF、TIFF 和 DjVu 檔案。
- 識別資料夾中的所有檔案。
- 識別存檔中的所有文件。
- 識別清單中的所有文件。
透過樣本學習
Python 版 OCR 提供了一系列以 Python 編寫的範例,讓您快速熟悉其功能和功能。獲得有關創建自訂解決方案以滿足您的 Python 業務需求的見解。
特性和功能
Aspose.OCR for Python via .NET 快速輕鬆地解決您的任務。
照片識別
以掃描級精度從智慧型手機照片中提取文字。
可搜尋的 PDF
將任何掃描件轉換為完全可搜尋、可索引和可編輯的文件。
網址識別
從 URL 識別圖像,無需下載到本機。
大量識別
讀取多頁文件、資料夾和檔案中的所有影像。
任何字體和样式
識別並識別所有流行字體和样式的文字。
微調識別
調整每個 OCR 參數以獲得最佳識別結果。
拼字檢查器
透過自動更正拼字錯誤的單字來提高結果。
尋找圖像中的文本
在一組圖像中搜尋文字或正規表示式。
比較圖像文本
比較兩個圖像上的文本,無論大小寫和佈局如何。
Python 程式碼範例
深入研究程式碼範例,將 OCR 無縫整合到您的 Python 應用程式中。
安裝
Aspose.OCR for Python via .NET 作為 Python Wheel 或獨立的可下載套件進行分發,很容易分發。直接從您首選的 Python 整合開發環境 (IDE) 整合到您的 Python 專案是一個無縫的過程。只需安裝它,您就可以利用完整的 OCR 功能,以各種格式保存識別結果。的限制。臨時許可證可解除 30 天內的所有試用版限制。利用這段時間開始開發功能齊全的 OCR 應用程序,以便您在稍後階段做出明智的決定是否透過 .NET 購買 Aspose.OCR for Python。
載入許可證
lic = License()
lic.set_license(self.licPath)
辨識照片上的文字
從 Aspose OCR for Python 中的任何內容讀取文字就像呼叫通用識別方法一樣簡單。
將照片轉換為文字 - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python 通用轉換器
我們的 API 能夠熟練地讀取來自掃描器、相機或智慧型手機的任何影像:PDF 文件、JPEG、PNG、TIFF、GIF、BMP 影像,甚至 DjVu 檔案。對多頁 PDF 文件、TIFF 和 DjVu 影像的全面支援確保了多功能性。您也可以透過 URL 提供來自網路的圖像。
識別結果以流行的文件和資料交換格式傳回:純文字、PDF、Microsoft Word、Microsoft Excel、JSON 和 XML。
識別 PDF 並將結果儲存為各種輸出格式 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Python 中的資源優化
光學字元辨識需要資源。我們的 API 提供了一種靈活的方法來平衡經典的時間-價格-品質三元組:
- 在徹底識別和快速識別之間進行選擇。
- 指定分配用於識別的執行緒數,或允許庫自動縮放到處理器核心的數量。
- 透過將計算卸載到 .NET 後端來釋放 CPU。
快速識別——Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
識別單行
如果您的圖像已被修剪為單行文本,則可以以最快的模式對其進行識別,而無需自動更正、內容結構檢測和其他消耗資源的步驟。它可以將 OCR 速度比正常識別過程快 7 倍。
識別圖像上的單行文字 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)