為什麼aspose.ocr for python via via .net?

通過.NET乘坐Aspose OCR乘坐Aspose OCR(一種多功能且用戶友好的OCR API)踏上了Python的旅程。將OCR功能嵌入您的Python應用程序中,其代碼少於5行,從而消除了對複雜的數學或神經網絡的需求。我們強大的OCR引擎提供了無與倫比的速度和準確性,支持140多種語言,包括英語,西里爾,阿拉伯語,波斯語,印地語,中國,日語,韓文,泰米爾語等。無論是掃描的圖像,智能手機照片,屏幕截圖還是掃描的PDF,都以流行文檔和數據交換格式獲得結果。利用預處理過濾器來處理旋轉,偏斜和嘈雜的圖像。

Illustration ocr

高效而精確的OCR

通過先進的Python技術,在OCR結果中體驗無與倫比的速度和精度。

多種語言

以140多種語言識別文本:英語,法語,德語,西班牙語,俄語,中文,印地語,日語,韓語,泰米爾語,阿拉伯語,波斯語等。

普遍的

使用Python輕鬆地處理來自掃描儀,相機和智能手機的各種來源的圖像。

亞洲語言

精確地認識了中文,阿拉伯語,Devanagari和Dravidian腳本,以及混合語言文本。

保留佈局

維護源格式以進行準確的文本表示,並識別表。

實時代碼樣本

將圖像轉換為文本,僅在三行Python代碼中。為自己嘗試!

準備識別 準備識別 在此處放置文件或單擊瀏覽 *

*通過上傳文件或使用您同意我們的服務 使用條款隱私政策.

識別結果
 

將圖像轉換為文字

發現更多例子 >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

選擇您的偏好

為您的需求選擇合適的庫。探索可用的API及其選擇最有效解決方案的功能。

多功能性

Python via .NET

代碼的易於開發,可讀性和可維護性
擁有最多的功能並獲得最頻繁的更新
總體速度可能比其他平台慢一點

統一

Python via Java

在任何平台上使用相同的庫
在任何設備上無縫運行您的應用程序
需要Java運行時環境(JRE)版本8或更高版本

表現

Python via C++

無論平台如何,最快的速度
對資源管理的大量控制
針對經驗豐富的開發人員

到處跑

無論名稱如何,python via via a aspose.ocr不需要在目標平台上安裝.net。安裝軟件包已經隨附所有必需的組件,並且可以在任何平台上無縫操作 - 無論是本地計算機,Web服務器還是雲。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

支持的文件格式

Aspose.OCR for Python via .NET 可以使用任何 文件 您可以從掃描儀或相機中獲得。識別結果可以保存,導入到數據庫或實時分析。

圖像

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

批量OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

識別結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

安裝

aspose.ocr for python via via .net作為Python包裹的套件,或[可下載的文件](https://releases.aspose.com/ocr/py/python-net/)或[pypi package https://releases.aspose.com.com.com.com/propi.org/popi.org/propopect/aspose-appose-ocr-pocr-pocr-py–pocr-pyynet/net/—輕鬆[install](https://docs.aspose.com/ocr/python-net/installation/)它進入您的項目,您可以用140多種語言識別文本,並以各種格式保存識別結果。

[請求試用許可證](https://purchase.aspose.com/temporary-license),以啟動無限制的功能性OCR應用程序的開發。

在Python下的OCR

我們的庫輕鬆集成,使Python應用程序能夠在任何平台上無縫運行 - 桌面Windows,Windows Server,Macos,Linux和The Cloud。

140多種識別語言

我們的Java OCR庫是在全球範圍內用於文檔處理,數據提取和內容數字化的通用解決方案。為了支持各種歐洲,中東和亞洲寫作腳本,它適合任何國家和商業。

Java的Aspose OCR在多語言文檔中識別文本,例如中文/英語,阿拉伯語/法語或西里爾/英語。支持以下語言:

  • 擴展拉丁語:英語,西班牙語,法語,印尼,葡萄牙語,德國,越南語,土耳其語,意大利語,波蘭語和80歲以上;
  • 西里爾字母:俄羅斯,烏克蘭,哈薩克,保加利亞人,包括混合的西里爾/英語文本;
  • 阿拉伯語,波斯語,烏爾都語,包括與英語混合的文字;
  • 中文,韓國,日本,德文納加里和德拉維語,包括印地語,泰米爾語,馬拉地語等。還支持混合語言文本。

強大的處理過濾器

光學特徵識別的準確性和可靠性高度取決於原始圖像的質量。 python的Aspose OCR通過.NET提供大量的全自動和手動圖像處理過濾器,這些濾鏡在將圖像發送到OCR引擎之前會增強圖像:

  • 自動顛倒並旋轉圖像。
  • 檢測倒立的圖像並提取黑色的白色文本。
  • 自動刪除污垢,斑點,划痕,眩光,不需要的梯度和其他噪音。
  • 自動調整圖像對比度。
  • 自動高檔或手動調整圖像大小。
  • 將圖像轉換為黑白或灰色。
  • 找到圖像的潛在問題區域,並返回有關缺陷類型及其坐標的信息。
  • 增加圖像中字符的厚度。
  • 保留字母邊緣時模糊嘈雜的圖像。
  • 弄平頁面曲率並修復了頁面照片的相機鏡頭失真。

針對特定文檔類型進行了優化

Python通過.NET的Aspose OCR提供了經過特殊訓練的神經網絡,可從某些類型的圖像中提取文本,以最大的準確性:

內置咒語檢查器

儘管我們的Python OCR庫提供了高識別精度,但打印缺陷,污垢或非標準字體可能會導致某些字符或單詞被錯誤地識別。為了進一步改善識別結果,您可以打開拼寫檢查器,該檢查器可以根據所選的識別語言找到並自動糾正拼寫錯誤。

如果公認的文本包含常見拼寫字典中不存在的專業術語,縮寫和其他單詞,則可以提供自己的單詞列表。

批識別

我們的Python OCR API使您擺脫了一個一個一個一個一個識別圖像。採用各種批處理方法在一個呼叫中識別多個圖像:

  • 識別多頁PDF,TIFF和DJVU文件。
  • 識別文件夾中的所有文件。
  • 識別存檔中的所有文件。
  • 從列表中識別所有文件。

通過樣本學習

python的OCR提供了一系列[示例](https://docs.aspose.com/ocr/python-net/developer-reference/),用python編寫,使您可以快速熟悉其功能和能力。獲得創建量身定制的解決方案以滿足您的Python業務需求的見解。

功能和功能

Aspose.OCR for Python via .NET Aspose.ocr for Python通過.NET快速而簡單地解決您的任務。

Feature icon

照片OCR

從智能手機照片中提取文字,具有掃描級別的精度。

Feature icon

可搜索的PDF

將任何掃描轉換為完全可搜索,可索引和可編輯的文檔。

Feature icon

URL識別

識別來自URL的圖像而無需在本地下載。

Feature icon

散裝認可

閱讀來自多頁文檔,文件夾和檔案的所有圖像。

Feature icon

任何字體和样式

識別並識別所有流行字體和样式中的文本。

Feature icon

微調識別

調整每個OCR參數以獲得最佳識別結果。

Feature icon

拼寫檢查器

通過自動糾正拼寫錯誤的單詞來改善結果。

Feature icon

在圖像中找到文字

在一組圖像中搜索文本或正則表達式。

Feature icon

比較圖像文本

無論情況和佈局如何,都比較兩個圖像上的文本。

Python代碼樣本

深入研究代碼樣本,將OCR無縫集成到您的Python應用程序中。

安裝

以python輪或獨立下載的軟件包的形式分發,aspose.ocr for python via via .net很容易分發。直接來自您首選的Python集成開發環境(IDE),整合到Python項目中,是一個無縫的過程。只需安裝它,就可以準備好利用OCR功能的完整範圍,以節省識別方式各種格式。

後安裝後,您可以迅速開始使用aspose.ocr for python via via .net,儘管有一定的限制。臨時許可將使所有試用版本限制30天。利用這一時期來啟動功能齊全的OCR應用程序的開發,使您可以在以後的階段對Python for Python做出明智的決定。

加載許可證

lic = License()
lic.set_license(self.licPath)

在照片上識別文字

從Aspose OCR中的任何內容中讀取文本,就像調用通用識別方法一樣容易。

將照片轉換為文字-Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python通用轉換器

我們的API擅長讀取掃描儀,相機或智能手機的任何圖像:PDF文檔,JPEG,PNG,TIFF,GIF,GIF,BMP圖像,甚至DJVU文件。對多頁PDF文檔,TIFF和DJVU圖像的全面支持可確保多功能性。您還可以通過URL從Web提供圖像。

識別結果以流行文檔和數據交換格式返回:純文本,PDF,Microsoft Word,Microsoft Excel,JSON和XML。

識別PDF並將結果保存到各種輸出格式-Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Python中的資源優化

光學特徵識別需要資源。我們的API提供了平衡經典時間價格質量三合會的靈活方法:

  • 在透徹識別和快速識別之間進行選擇。
  • 指定分配識別的線程數,或允許庫自動擴展到處理器內核的數量。
  • 通過將計算釋放到.NET後端來釋放CPU。

快速識別 - python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

識別單行

如果您的圖像已經將其修剪為單行文本,則可以在最快的模式下識別它,而無需自動校正,內容結構檢測和其他資源耗費的步驟。它可以加快OCR的速度比正常識別過程快7倍。

在圖像上識別單行文本 - python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)