Python OCRライブラリ
Python OCRを使用して画像をテキストに変換します
その他のショーケース ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
.NET経由でPython用のAspose.ocrがなぜですか?
.NET経由でPython用のAspose OCRとの旅に乗り出します。 OCR機能を5行未満のコードでPythonアプリケーションに埋め込み、複雑な数学またはニューラルネットワークの必要性を排除しました。当社の強力なOCRエンジンは、比類のない速度と精度を提供し、英語、キリル語、アラビア語、ペルシャ語、ヒンディー語、中国語、日本語、韓国語、タミルなどの140以上の言語をサポートします。スキャンされた画像、スマートフォンの写真、スクリーンショット、またはスキャンされたPDFであろうと、人気のあるドキュメントとデータ交換形式で結果を取得します。前処理フィルターを活用して、回転、歪んだ、ノイズの多い画像を処理します。

効率的かつ正確なOCR
高度なPythonテクノロジーを使用して、OCRの比類のない速度と精度を体験してください。
多言語
英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、ヒンディー語、日本語、韓国語、タミル語、アラビア語、ペルシャ語など:140以上の言語でテキストを認識します。
ユニバーサル
Pythonを使用して、スキャナー、カメラ、スマートフォン(カメラ、スマートフォン)からの画像を簡単に処理します。
アジア語
中国語、アラビア語、デヴァナガリ、ドラヴィダの脚本、および混合言語のテキストの正確な認識を実現します。
レイアウトを保持します
正確なテキスト表現のためにソースのフォーマットを維持し、表を認識します。
ライブコードサンプル
Pythonコードのわずか3行で画像をテキストに変換します。自分で試してみてください!
*ファイルをアップロードするか、サービスを使用することにより、私たちに同意することにより 利用規約 そして プライバシーポリシー.
画像をテキストに変換します
より多くの例を発見してください ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
あなたの好みを選択してください
ニーズに合った適切なライブラリを選択してください。利用可能なAPIとその機能を調査して、最も効率的なソリューションを選択します。
汎用性
Python via .NET
均一
Python via Java
パフォーマンス
Python via C++
どこでも走ります
名前に関係なく、.NET経由でpython用のAsophes.ocrは、ターゲットプラットフォームに.NETをインストールする必要はありません。インストールパッケージには、必要なすべてのコンポーネントが既に付属しており、ローカルマシン、Webサーバー、クラウドなど、あらゆるプラットフォームでシームレスに動作できます。
サポートされているファイル形式
Aspose.OCR for Python via .NET [ファイル]で動作することができます( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) スキャナーやカメラから入手できます。認識結果は、保存したり、データベースにインポートしたり、リアルタイムで分析されたりできます。
画像
- JPEG
- PNG
- TIFF
- BMP
- GIF
バッチOCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
認識結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
インストール
.NET経由でPython用のAspose.ocrは、最小限の依存関係を備えたPythonパッケージとして、または[ダウンロード可能なファイル](https://releases.aspose.com/ocr/python-net/)または[pypi package](https://pypi.org/project/asospos-python-net/)として配信されます。簡単に[インストール](https://docs.aspose.com/ocr/python-net/installation/)プロジェクトに参加すると、140+言語でテキストを認識し、さまざまな形式で認識結果を保存する準備が整います。
[トライアルライセンスを要求](https://purchase.aspose.com/temporary-license)完全に機能的なOCRアプリケーションの開発を制限せずに開始します。
Python下のOCR
ライブラリは簡単に統合され、PythonアプリケーションがデスクトップWindows、Windows Server、MacOS、Linux、The Cloudの任意のプラットフォームでシームレスに実行できるようにします。
140以上の認識言語
Java OCRライブラリは、グローバルスケールでのドキュメント処理、データ抽出、コンテンツデジタル化のための普遍的なソリューションです。ヨーロッパ、中東、アジアの執筆スクリプトの膨大な数々を支援しているため、あらゆる国やビジネスに適しています。
JavaのAspose OCRは、中国語/英語、アラビア語/フランス語、キリル/英語などの多言語文書でテキストを認識しています。次の言語がサポートされています。
- 拡張ラテン語:英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、および80歳以上。
- キリル語アルファベット:ロシア語、ウクライナ人、カザフ、ブルガリア語、混合キリル語/英語のテキストを含む。
- アラビア語、ペルシャ語、ウルドゥー語、英語と混ざったテキストを含む。
- ヒンディー語、タミル語、マラーティー語などを含む中国語、韓国語、日本語、デヴァナガリ、ドラヴィダ語。混合言語テキストもサポートされています。
強力な処理フィルター
光学文字認識の精度と信頼性は、元の画像の品質に大きく依存しています。 .NET経由でPython用のAspose OCRは、OCRエンジンに送信される前に画像を強化する完全に自動化された手動画像処理フィルターを多数提供しています。
- 逆さまの画像と回転した画像を自動的に回転させます。
- 反転した画像を検出し、白色のブラックテキストを抽出します。
- 汚れ、斑点、傷、まぶしさ、不要な勾配、その他のノイズを自動的に除去します。
- 画像のコントラストを自動的に調整します。
- 自動的にアップスケールするか、画像を手動でサイズ変更します。
- 画像を白黒またはグレースケールに変換します。
- 画像の潜在的に問題のある領域を見つけて、欠陥の種類とその座標に関する情報を返します。
- 画像内の文字の厚さを増やします。
- 文字の端を保存しながら、ノイズの多い画像をぼんやりとします。
- ページの曲率をまっすぐにし、ページ写真のカメラレンズの歪みを修正します。
特定のドキュメントタイプに最適化されています
.NET経由でPython用のAspose OCRは、特別に訓練されたニューラルネットワークを提供し、特定のタイプの画像から最大精度でテキストを抽出します。
組み込みのスペルチェッカー
Python OCRライブラリは高い認識の精度を提供しますが、印刷の欠陥、汚れ、または非標準のフォントは、特定の文字または単語が誤って認識される可能性があります。認識結果をさらに改善するために、選択した認識言語に基づいてスペルエラーを見つけて自動的に修正するスペルチェッカーをオンにすることができます。
認識されたテキストに、特殊な用語、略語、および一般的なスペルディクショナリに存在しないその他の単語が含まれている場合、独自の単語リストを提供できます。
バッチ認識
私たちのPython OCR APIは、画像を1つずつ認識することを解放します。さまざまなバッチ処理方法を使用して、1つの呼び出しで複数の画像を認識します。
- マルチページPDF、TIFF、およびDJVUファイルの認識。
- フォルダー内のすべてのファイルの認識。
- アーカイブ内のすべてのファイルの認識。
- リストからすべてのファイルの認識。
サンプルによる学習
OCR for Pythonは、[例](https://docs.aspose.com/ocr/python-net/developer-reference/)の配列をPythonで提供し、その機能と機能をすばやく知ることができます。 Pythonビジネスのニーズを満たすために、テーラードソリューションを作成するための洞察を得る。
機能と機能
Aspose.OCR for Python via .NET .NET経由でPython用のAspose.ocrは、タスクを迅速かつ簡単に解決します。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
スキャンを完全に検索可能でインデックス可能な編集可能なドキュメントに変換します。
URL認識
ローカルにダウンロードせずにURLから画像を認識します。
バルク認識
マルチページドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
フォントとスタイル
すべての人気のある書体とスタイルでテキストを特定して認識します。
微調整の認識
最良の認識結果については、すべてのOCRパラメーターを調整します。
スペルチェッカー
間違いのある単語を自動的に修正することにより、結果を改善します。
画像でテキストを見つけます
一連の画像内でテキストまたは正規表現を検索します。
画像テキストを比較します
ケースとレイアウトに関係なく、2つの画像のテキストを比較します。
Pythonコードサンプル
コードサンプルを掘り下げて、OCRをPythonアプリケーションにシームレスに統合します。
インストール
Pythonホイールまたは自己完結型のダウンロード可能なパッケージとして配布されているAspose.ocr for Python via .netは簡単に配布されます。 Pythonプロジェクトへの統合は、Python統合開発環境(IDE)から直接、シームレスなプロセスです。単にインストールするだけで、OCR機能の完全な範囲を活用し、認識結果をさまざまな形式で節約する準備ができています。一時的なライセンスにより、30日間のすべての試用版の制限が解除されます。この期間を利用して完全に機能するOCRアプリケーションの開発を開始し、後の段階で.NETを介してPythonのAspose.ocrの購入について情報に基づいた決定を下すことができます。
ロードライセンス
lic = License()
lic.set_license(self.licPath)
写真にテキストを認識します
Python用のAsopes OCRのコンテンツからテキストを読むことは、ユニバーサル認識方法を呼び出すのと同じくらい簡単です。
写真をテキストに変換します-Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
APIは、スキャナー、カメラ、またはスマートフォンからの画像をあらゆる画像で読み取ります:PDFドキュメント、JPEG、PNG、TIFF、GIF、BMP画像、さらにはDJVUファイル。マルチページPDFドキュメント、TIFF、およびDJVU画像の完全なサポートにより、汎用性が保証されます。 URLを介してWebから画像を提供することもできます。
認識結果は、一般的なドキュメントおよびデータ交換形式で返されます:Plain Text、PDF、Microsoft Word、Microsoft Excel、JSON、およびXML。
PDFを認識し、結果をさまざまな出力形式に保存-Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Pythonのリソース最適化
光学文字認識にはリソースが必要です。私たちのAPIは、古典的な時間価格のトライアドのバランスをとる柔軟な方法を提供します。
- 徹底的な認識と迅速な認識から選択します。
- 認識のために割り当てられたスレッドの数を指定するか、ライブラリがプロセッサコアの数に自動的にスケーリングできるようにします。
- .NETバックエンドに計算をオフロードすることにより、CPUを無料で解放します。
高速認識-Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
シングルラインを認識します
画像が既に単一のテキストにトリミングされている場合、自動化された修正、コンテンツ構造の検出、その他のリソースを消費する手順なしで、可能な限り速いモードで認識できます。通常の認識プロセスよりも最大7倍高速でOCRをスピードアップできます。
画像上でテキストの単一行を認識します-Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)