Python 光學字符識別 API

從掃描圖像、照片和屏幕截圖中提取文本，創建可搜索的 PDF，搜索和比較圖像中的文本，等等。

Aspose.OCR for Python via .NET 是一款功能強大且易於使用的光學字符識別 (OCR) 引擎，適用於您的 Python 應用程序和筆記本。只需不到 10 行代碼，您就可以識別基於拉丁文、西里爾文和亞洲文字的 28 種語言的文本，並以最流行的文檔和數據交換格式返回結果。無需學習複雜的數學模型、構建機器學習算法和訓練神經網絡 — 我們簡單而強大的 API 將為您做一切。

該庫適用於所有來源，從高質量掃描到智能手機上的快速照片。圖像是否旋轉、扭曲或有噪聲 — 自動預處理和後處理過濾器可在最短的時間內提供最高的識別精度。

乍看上去

從任何圖像類型中提取主要歐洲和亞洲語言的文本

圖像類型

照片
書籍
文章
合同
身份證
護照
收據
發票
車牌
還有更多...

支持的語言

英語
中文
印地語
德語
法語
西班牙語
俄語
意大利語
波蘭語
還有更多...

Aspose.OCR

平台獨立性

Aspose.OCR for Python via .NET 在 Python 3.6 或更高版本下工作

Desktop OS

Windows 7
Windows 8
Windows 10
Windows 11
Linux

Server OS

Windows Server 2008
Windows Server 2012
Windows Server 2016
Windows Server 2019
Windows Server 2022

Aspose.OCR

支持的文件格式

將來自掃描儀、相機或互聯網的任何圖像轉換為最流行的文檔和數據交換格式

源文件

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

識別結果

Searchable PDF
Microsoft Word
Microsoft Excel
EPUB
Plain text
JSON
XML

Aspose.OCR

特性和功能

從掃描件、照片和屏幕截圖中提取文本

將掃描的 PDF 轉換為可搜索和可索引的 PDF

閱讀所有流行字體的拉丁文、西里爾文和亞洲文字

認識6000多個漢字

處理模糊、扭曲、旋轉和有噪聲的圖像

識別並保留原始文本佈局中的內容塊

檢測並讀取圖像的區域：段落、線條和單個單詞

批量處理多頁文檔、文件夾和檔案

識別來自互聯網的圖像，無需下載

識別並自動糾正拼寫錯誤的單詞

查找圖像中的文本並智能比較圖像文本

便於使用

您只需要 5 行代碼即可識別圖像並顯示結果。是的，確實就是這麼簡單！

準備好識別認識將文件拖放到此處或單擊瀏覽 *

* 通過上傳您的文件或使用我們的服務，您同意我們的使用條款和隱私政策.

實時代碼示例 - Python 3

# 初始化 OCR 引擎
recognitionEngine = AsposeOcr()
# 將圖像添加到批次
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# 從圖像中提取文本
result = recognitionEngine.recognize(input)
# 顯示識別結果
print(result[0].recognition_text)

Recognition result

28種識別語言

Aspose.OCR for Python via .NET 可以識別大量語言和所有流行的書寫文字，包括混合語言的文本：

擴展拉丁字母: 克羅地亞語、捷克語、丹麥語、荷蘭語、英語（包括手寫體）、愛沙尼亞語、芬蘭語、法語、德語、意大利語、拉脫維亞語、立陶宛語、挪威語、波蘭語、葡萄牙語、羅馬尼亞語、斯洛伐克語、斯洛文尼亞語、西班牙語、瑞典語。
西里爾字母：白俄羅斯語、保加利亞語、哈薩克語、俄語、塞爾維亞語、烏克蘭語。
中文：超過 6,000 個字符。
印地語

您還可以閱讀基於擴展拉丁語和西里爾語的其他語言的文本，即使 OCR 引擎不直接支持它們。例如拉丁語、越南語、蓋爾語等。

強大的處理過濾器

光學字符識別的準確性和可靠性很大程度上取決於原始圖像的質量。 Aspose.OCR for Python via .NET提供大量全自動和手動圖像處理過濾器，可在將圖像發送到 OCR 引擎之前對其進行增強：

自動拉直與水平方向成微小角度的圖像。
手動旋轉嚴重傾斜的圖像。
自動去除污垢、斑點、划痕、眩光、不需要的漸變和其他噪音。
自動調整圖像對比度。
自動放大圖像或手動調整圖像大小。
將圖像轉換為黑白或灰度圖像。
反轉圖像顏色，使亮區顯得較暗，暗區顯得較亮。
增加圖像中字符的粗細。
模糊嘈雜的圖像，同時保留字母的邊緣。
拉直頁面曲率並修復頁面照片的相機鏡頭畸變。

這些濾鏡可以組合併應用於整個圖像或僅應用於圖像的選定區域，以及批處理。您不僅可以在識別管道中微調預處理，還可以存儲處理後的圖像以供顯示、緩存和調試。

針對特定文檔類型進行了優化

Aspose.OCR for Python via .NET 提供經過專門訓練的神經網絡，以最高精度從某些類型的圖像中提取文本：

身份證和護照的掃描件或照片。
車輛牌照。
發票。
收據。

內置拼寫檢查器

雖然 Aspose.OCR for Python via .NET 識別精度高，印刷缺陷、污垢或不標準字體可能會導致某些字符或文字無法正確識別。為了進一步提高識別結果，您可以打開拼寫檢查器，它會根據所選的識別語言查找並自動糾正拼寫錯誤。

如果識別的文本包含專業術語、縮寫詞以及常見拼寫詞典中不存在的其他單詞，您可以提供自己的單詞列表。

創建可搜索的 PDF

即使具有最高的識別精度，原始圖像也可能包含大量重要的非文本信息或者僅僅具有巨大的歷史價值。 Aspose.OCR for Python via .NET提供了一個簡單而優雅的解決方案，結合了兩全其美的優點。我們從圖像、PDF 文檔或文件包中提取文本，並將其作為不可見的文本層放置在原始圖像之上。結果以 PDF 格式保存，這是存儲和共享文檔的行業標準。可以對生成的文件進行搜索和索引，並且可以選擇和復製文本，就像選擇和復制原始字符一樣。

批量識別

Aspose.OCR for Python via .NET 允許您識別多個文件，無論其數量和類型如何，就像讀取單個圖像一樣簡單。通過一次 API 調用，您可以從自動送紙掃描儀中識別多個頁面，或從自動交通攝像頭中提取車輛牌照。

結果可以保存為可搜索的 PDF 文檔或電子表格，或以純文本、JSON 或 XML 形式返回以供進一步分析。

Support and Learning Resources

為什麼 Aspose.OCR for Python via .NET?
客戶名單
成功的故事

Download Free Trial Pricing Information

Aspose 還為其他流行的編程語言提供本機 OCR API：

Python 光學字符識別 API

從掃描圖像、照片和屏幕截圖中提取文本，創建可搜索的 PDF，搜索和比較圖像中的文本，等等。

Aspose.OCR for Python via .NET

Overview

乍看上去

平台獨立性

支持的文件格式

特性和功能

便於使用

實時代碼示例 - Python 3

28種識別語言

強大的處理過濾器

針對特定文檔類型進行了優化

內置拼寫檢查器

創建可搜索的 PDF

批量識別

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++

Aspose.OCR for.NET