Python OCR ライブラリ
Python OCR を使用して画像をテキストに変換する
その他のショーケース ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
.NET 経由で Python に Aspose.OCR を使用する理由
.NET 経由で Aspose OCR for Python を使用して旅を始めましょう。これは多用途でユーザーフレンドリーな OCR API です。 5 行未満のコードで OCR 機能を Python アプリケーションに埋め込み、複雑な数学やニューラル ネットワークの必要性を排除します。当社の強力な OCR エンジンは、比類のない速度と精度を実現し、英語、キリル語、アラビア語、ペルシア語、ヒンディー語、中国語、日本語、韓国語、タミル語などを含む 130 以上の言語をサポートしています。スキャンされた画像、スマートフォンの写真、スクリーンショット、またはスキャンされた PDF のいずれであっても、一般的なドキュメントおよびデータ交換形式で結果を取得します。前処理フィルターを活用して、回転、歪み、ノイズのある画像を処理します。
効率的かつ正確な OCR
高度な Python テクノロジーを使用して、比類のない速度と精度の OCR 結果を体験してください。
多言語対応
140 以上の言語のテキストを認識します: 英語、フランス語、ドイツ語、スペイン語、ロシア語、中国語、ヒンディー語、日本語、韓国語、タミル語、アラビア語、ペルシア語など。
ユニバーサル
Python を使用して、スキャナー、カメラ、スマートフォンなどのさまざまなソースからの画像を簡単に処理します。
アジアの言語
中国語、アラビア語、デヴァナーガリー文字、ドラヴィダ文字、および混合言語のテキストを正確に認識します。
レイアウトを保持する
正確なテキスト表現のためにソースの書式を維持し、表を認識します。
ライブコードサンプル
わずか 3 行の Python コードで画像をテキストに変換します。自分で試してみてください!
* ファイルをアップロードするかサービスを使用することにより、当社の 利用規約 そして プライバシーポリシー.
画像をテキストに変換する
さらに多くの例を見つける ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
好みを選択してください
ニーズに合わせて適切なライブラリをお選びください。利用可能な API とその機能を調べて、最も効率的なソリューションを選択します。
多用途性
Python via .NET
均一
Python via Java
パフォーマンス
Python via C++
どこでも走ります
名前に関係なく、.NET 経由の Aspose.OCR for Python では、ターゲット プラットフォームに .NET をインストールする必要はありません。インストール パッケージには必要なコンポーネントがすべて含まれており、ローカル マシン、Web サーバー、クラウドなど、あらゆるプラットフォームでシームレスに動作できます。
サポートされているファイル形式
Aspose.OCR for Python via .NET 任意の[ファイル]を操作できます( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は保存したり、データベースにインポートしたり、リアルタイムで分析したりできます。
画像
- JPEG
- PNG
- TIFF
- BMP
- GIF
バッチOCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
認識結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
インストール
.NET 経由の Aspose.OCR for Python は、最小限の依存関係を持つ Python パッケージとして、または ダウンロード可能なファイル または [PyPI パッケージ](https: //pypi.org/project/aspose-ocr-python-net/)。これをプロジェクトに簡単に インストール するだけで、140 以上の言語のテキストを認識し、認識結果をさまざまな形式で保存できるようになります。
試用ライセンスをリクエスト して、制限なしで完全に機能する OCR アプリケーションの開発を開始します。
Python での OCR
私たちのライブラリは簡単に統合できるため、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームで Python アプリケーションをシームレスに実行できます。
140 以上の認識言語
当社の Java OCR ライブラリは、世界規模での文書処理、データ抽出、コンテンツのデジタル化のためのユニバーサル ソリューションです。ヨーロッパ、中東、アジアの膨大な数の筆記体をサポートしているため、あらゆる国やビジネスにうまく適応できます。
Aspose OCR for Java は、中国語/英語、アラビア語/フランス語、キリル語/英語などの多言語ドキュメント内のテキストを認識します。次の言語がサポートされています。
- 拡張ラテン語: 英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、その他 80 以上;
- キリル文字 アルファベット: ロシア語、ウクライナ語、カザフ語、ブルガリア語 (キリル文字と英語の混合テキストを含む)。
- アラビア語、ペルシア語、ウルドゥー語、英語と混合したテキストを含む。
- 中国語、韓国語、日本語、デーヴァナーガリー語、ヒンディー語、タミル語、マラーティー語などのドラヴィダ語。混合言語のテキストもサポートされています。
強力な処理フィルター
光学式文字認識の精度と信頼性は、元の画像の品質に大きく依存します。 Aspose OCR for Python via .NET は、OCR エンジンに送信される前に画像を強化する、完全に自動化された手動の画像処理フィルターを多数提供します。
- 上下逆さまや回転した画像も自動で回転します。
- 反転した画像を検出し、黒地に白のテキストを抽出します。
- 汚れ、シミ、傷、まぶしさ、不要なグラデーション、その他のノイズを自動的に除去します。
- 画像のコントラストを自動的に調整します。
- 画像を自動的にアップスケールするか、手動でサイズを変更します。
- 画像を白黒またはグレースケールに変換します。
- 画像内で問題がある可能性のある領域を見つけて、欠陥の種類とその座標に関する情報を返します。
- 画像内の文字を太くします。
- 文字のエッジを残したまま、ノイズの多い画像をぼかします。
- ページの湾曲をまっすぐにし、ページ写真のカメラレンズの歪みを修正します。
特定のドキュメントタイプに最適化
Aspose OCR for Python via .NET は、特定の種類の画像からテキストを最高の精度で抽出するために特別にトレーニングされたニューラル ネットワークを提供します。
内蔵スペルチェッカー
当社の Python OCR ライブラリは高い認識精度を提供しますが、印刷欠陥、汚れ、または標準以外のフォントにより、特定の文字や単語が正しく認識されない可能性があります。認識結果をさらに向上させるには、スペル チェッカーを有効にすると、選択した認識言語に基づいてスペル エラーを検出し、自動的に修正します。
認識されたテキストに、一般的なスペル辞書に存在しない専門用語、略語、その他の単語が含まれている場合は、独自の単語リストを提供できます。
バッチ認識
当社の Python OCR API を使用すると、画像を 1 つずつ認識する作業から解放されます。さまざまなバッチ処理方法を使用して、1 回の呼び出しで複数の画像を認識します。
- 複数ページの PDF、TIFF、および DjVu ファイルの認識。
- フォルダー内のすべてのファイルを認識します。
- アーカイブ内のすべてのファイルの認識。
- リストからのすべてのファイルの認識。
サンプルで学ぶ
OCR for Python は、Python で書かれた サンプル の配列を提供し、その機能と機能をすぐに理解できるようにします。 Python のビジネス ニーズを満たすカスタマイズされたソリューションを作成するための洞察を得ることができます。
特徴と機能
Aspose.OCR for Python via .NET タスクを迅速かつ簡単に解決します。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
あらゆるスキャンを完全に検索、インデックス付け、編集可能なドキュメントに変換します。
URL認識
画像をローカルにダウンロードせずに、URL から画像を認識します。
一括認識
複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
任意のフォントとスタイル
すべての一般的な書体とスタイルのテキストを識別して認識します。
認識を微調整する
最良の認識結果が得られるように、すべての OCR パラメータを調整します。
スペルチェッカー
スペルミスの単語を自動的に修正することで結果を改善します。
画像内のテキストを検索する
一連の画像内のテキストまたは正規表現を検索します。
画像テキストを比較する
大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。
Python コードサンプル
コード サンプルを詳しく調べて、OCR を Python アプリケーションにシームレスに統合します。
インストール
Aspose.OCR for Python は、Python Wheel または自己完結型のダウンロード可能なパッケージとして配布され、.NET 経由で簡単に配布できます。好みの Python 統合開発環境 (IDE) から直接、Python プロジェクトに統合することは、シームレスなプロセスです。インストールするだけで、あらゆる種類の OCR 機能を活用し、認識結果をさまざまな形式で保存する準備が整います。
インストール後は、.NET 経由で Aspose.OCR for Python の使用をすぐに開始できます。ただし、一定の制限があります。一時ライセンスにより、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後の段階で .NET 経由で Aspose.OCR for Python を購入するかどうかについて情報に基づいた決定を下すことができます。
ライセンスをロードする
lic = License()
lic.set_license(self.licPath)
写真上のテキストを認識する
Aspose OCR for Python のあらゆるコンテンツからテキストを読み取ることは、汎用認識メソッドを呼び出すのと同じくらい簡単です。
写真をテキストに変換する - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python ユニバーサル コンバーター
当社の API は、PDF ドキュメント、JPEG、PNG、TIFF、GIF、BMP 画像、さらには DjVu ファイルなど、スキャナー、カメラ、スマートフォンからあらゆる画像を適切に読み取ります。複数ページの PDF ドキュメント、TIFF、DjVu 画像を完全にサポートしているため、多用途性が保証されます。 URL を介して Web から画像を提供することもできます。
認識結果は、プレーン テキスト、PDF、Microsoft Word、Microsoft Excel、JSON、XML などの一般的なドキュメントおよびデータ交換形式で返されます。
PDF を認識し、結果をさまざまな出力形式で保存する - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Python でのリソースの最適化
光学式文字認識にはリソースが必要です。当社の API は、時間、価格、品質の古典的な 3 つのバランスをとる柔軟な方法を提供します。
- 完全な認識と高速認識のどちらかを選択します。
- 認識用に割り当てられるスレッドの数を指定するか、ライブラリがプロセッサ コアの数に合わせて自動的にスケーリングできるようにします。
- 計算を .NET バックエンドにオフロードすることで CPU を解放します。
高速認識 - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
単線を認識する
画像が既に 1 行のテキストにトリミングされている場合は、自動修正、コンテンツ構造の検出、その他のリソースを消費する手順を行わずに、可能な限り高速なモードで画像を認識できます。通常の認識プロセスよりも最大 7 倍高速に OCR を高速化できます。
画像上の単一行のテキストを認識する - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)