Python 用光学式文字認識 API

Python アプリケーションから、スキャンした画像、写真、スクリーンショットからテキストを抽出したり、検索可能な PDF を作成したり、画像内のテキストを検索および比較したりできます。

Aspose.OCR for Python via .NET は、Python アプリケーションおよびノートブック向けの強力でありながら使いやすい光学式文字認識 (OCR) エンジンです。 10 行未満のコードで、ラテン文字、キリル文字、アジア文字に基づく 28 言語のテキストを認識し、最も一般的なドキュメントおよびデータ交換形式で結果を返すことができます。複雑な数学モデルを学習したり、機械学習アルゴリズムを構築したり、ニューラルネットワークをトレーニングしたりする必要はありません。シンプルで堅牢な API がすべてを行います。

このライブラリは、高品質のスキャンからスマートフォン上の簡単な写真まで、あらゆるソースで同様に機能します。画像が回転していたり、歪んでいたり、ノイズが多かったりしていないか。自動前処理フィルタと後処理フィルタにより、最短時間で最高の認識精度が得られます。

一目でわかる

あらゆる種類の画像から主要なヨーロッパ言語とアジア言語のテキストを抽出

画像の種類

写真
本
記事
契約
ID カード
パスポート
領収書
請求書
ナンバープレート
その他...

サポートされている言語

英語
中国語
ヒンディー語
ドイツ語
フランス語
スペイン語
ロシア語
イタリア語
ポーランド語
その他...

Aspose.OCR

プラットフォームの独立性

Aspose.OCR for Python via .NET Python バージョン 3.6 以降で動作します

Desktop OS

Windows 7
Windows 8
Windows 10
Windows 11
Linux

Server OS

Windows Server 2008
Windows Server 2012
Windows Server 2016
Windows Server 2019
Windows Server 2022

Aspose.OCR

サポートされているファイル形式

スキャナー、カメラ、インターネットからのあらゆる画像を、最も一般的なドキュメントおよびデータ交換形式に変換します。

ソースファイル

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

認識結果

Searchable PDF
Microsoft Word
Microsoft Excel
EPUB
Plain text
JSON
XML

Aspose.OCR

特徴と機能

スキャン、写真、スクリーンショットからテキストを抽出

スキャンした PDF を検索可能でインデックス可能な PDF に変換します

ラテン文字、キリル文字、アジア文字をすべての一般的な書体で読むことができます

6,000以上の漢字を認識

ぼやけた、歪んだ、回転した、ノイズのある画像を扱う

元のテキストレイアウトからコンテンツブロックを特定して保存する

画像の領域（段落、行、単一の単語）を検出して読み取ります。

複数ページのドキュメント、フォルダー、アーカイブを一括処理

ダウンロードせずにインターネットから画像を認識します

スペルミスの単語を特定して自動的に修正する

画像内のテキストを検索し、画像テキストをインテリジェントに比較します

使いやすい

画像を認識して結果を表示するには、5 行のコードのみが必要です。はい、本当に簡単です!

認識する準備ができています認識するここにファイルをドロップするか、クリックして参照します *

* ファイルをアップロードするかサービスを使用することにより、次のことに同意したことになります。利用規約とプライバシーポリシー.

ライブコードサンプル - Python 3

# Initialize OCR engine
recognitionEngine = AsposeOcr()
# 画像をバッチに追加
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# 画像からテキストを抽出する
result = recognitionEngine.recognize(input)
# 認識結果を表示する
print(result[0].recognition_text)

認識結果

28 の認識言語

Aspose.OCR for Python via .NET 多数の言語と、混合言語のテキストを含むすべての一般的な筆記体を認識できます。

拡張ラテン文字: クロアチア語、チェコ語、デンマーク語、オランダ語、英語 (手書き文字を含む)、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語
キリル文字: ベラルーシ語、ブルガリア語、カザフ語、ロシア語、セルビア語、ウクライナ語
中国語: 6,000 文字以上。
ヒンディー語

OCR エンジンで直接サポートされていない場合でも、拡張ラテン文字やキリル文字に基づく他の言語のテキストを読み取ることもできます。たとえば、ラテン語、ベトナム語、ゲール語などです。

強力な処理フィルター

光学式文字認識の精度と信頼性は、元の画像の品質に大きく依存します。 Aspose.OCR for Python via .NET は、OCR エンジンに送信される前に画像を強化する、完全に自動化された手動の画像処理フィルタを多数提供します。

水平に対してわずかな角度で配置された画像を自動的にまっすぐに補正します。
著しく歪んだ画像を手動で回転する
汚れ、シミ、傷、まぶしさ、不要なグラデーション、その他のノイズを自動的に除去します。
画像のコントラストを自動的に調整します。
画像を自動的にアップスケールするか、手動でサイズを変更します。
画像を白黒またはグレースケールに変換します。
画像の色を反転して、明るい部分が暗く見え、暗い部分が明るく見えるようにします。
画像内の文字の太さを増やします。
文字のエッジを維持しながら、ノイズの多い画像をぼかします。
ページの湾曲を矯正し、ページ写真のカメラレンズの歪みを修正します。

これらのフィルタを組み合わせて、画像全体に適用したり、画像の選択した領域のみに適用したり、バッチ処理で適用したりできます。認識パイプラインの前処理を微調整できるだけでなく、表示、キャッシュ、デバッグのために処理された画像を保存することもできます。

特定のドキュメントタイプに最適化

Aspose.OCR for Python via .NET 特別にトレーニングされたニューラルネットワークを提供し、特定の種類の画像からテキストを最高の精度で抽出します。

スキャンまたは写真撮影した ID カードとパスポート。
車両のナンバープレート。
請求書。
領収書。

内蔵スペルチェッカー

Although Aspose.OCR for Python via .NET 高い認識精度を提供しますが、印刷欠陥、汚れ、または標準以外のフォントにより、特定の文字や単語が正しく認識されない場合があります。認識結果をさらに向上させるには、スペルチェッカーを有効にすると、選択した認識言語に基づいてスペルエラーを検出し、自動的に修正できます。

認識されたテキストに、一般的なスペル辞書に存在しない専門用語、略語、その他の単語が含まれている場合は、独自の単語リストを提供できます。

検索可能な PDF の作成

認識精度が最も高くても、元の画像には多くの重要な非テキスト情報が含まれているか、単に歴史的に非常に価値のあるものである可能性があります。 Aspose.OCR for Python via .NET は、両方の長所を組み合わせたシンプルでエレガントなソリューションを提供します。画像、PDF ドキュメント、またはファイルパッケージからテキストを抽出し、元の画像の上に非表示のテキストレイヤーとして配置します。結果は、ドキュメントの保存と共有のための業界標準である PDF 形式で保存されます。結果のファイルは検索してインデックスを付けることができ、元の文字を選択してコピーするのと同じ方法でテキストを選択してコピーすることができます。

一括認識

Aspose.OCR for Python via .NET を使用すると、ファイルの数や種類に関係なく、単一の画像を読み取るのと同じくらい簡単に複数のファイルを認識できます。 1 回の API 呼び出しで、自動フィードスキャナから複数のページを認識したり、自動交通カメラから車両のナンバープレートを抽出したりできます。

結果は、検索可能な PDF ドキュメントまたはスプレッドシートとして保存することも、さらなる分析のためにプレーンテキスト、JSON、または XML として返すこともできます。

Support and Learning Resources

なぜ Aspose.OCR for Python via .NET?
顧客リスト
成功事例

Download Free Trial Pricing Information

Aspose は、他の一般的なプログラミング言語用のネイティブ OCR API も提供しています。

Python 用光学式文字認識 API

Python アプリケーションから、スキャンした画像、写真、スクリーンショットからテキストを抽出したり、検索可能な PDF を作成したり、画像内のテキストを検索および比較したりできます。

Aspose.OCR for Python via .NET

Overview

一目でわかる

プラットフォームの独立性

サポートされているファイル形式

特徴と機能

使いやすい

ライブコードサンプル - Python 3

28 の認識言語

強力な処理フィルター

特定のドキュメントタイプに最適化

内蔵スペルチェッカー

検索可能な PDF の作成

一括認識

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++

Aspose.OCR for.NET