.NET 経由で Python に Aspose.OCR を選択する理由は何ですか?

.NET 経由で Python 用の Aspose.OCR を使用する旅に乗り出しましょう。これは多用途でユーザーフレンドリーな OCR API です。 5 行未満のコードで OCR 機能を Python アプリケーションに埋め込み、複雑な数学やニューラル ネットワークの必要性を排除します。当社の強力な OCR エンジンは比類のない速度と精度を実現し、ラテン文字、キリル文字、中国語文字を含む 28 の言語をサポートします。スキャンされた画像、スマートフォンの写真、スクリーンショット、またはスキャンされた PDF のいずれであっても、一般的なドキュメントおよびデータ交換形式で結果を取得します。前処理フィルターを活用して、回転、歪み、ノイズのある画像を処理します。リソースを大量に消費するタスクを .NET バックエンドにオフロードすることで、認識パフォーマンスとシステム負荷を最適化します。

Illustration ocr

効率的かつ正確な OCR の習得

高度な Python および .NET テクノロジーを使用して、比類のない速度と精度の OCR 結果を体験してください。

多言語の卓越性

ラテン語、キリル文字、中国語を含む 28 の言語のテキストを簡単かつ正確に認識します。

適応可能な画像処理

Python と .NET を使用して、スキャナー、カメラ、スマートフォンなどのさまざまなソースからの画像を簡単に処理します。

漢字能力

Python と .NET で精度を確保し、6,000 を超える漢字の正確な認識を実現します。

フォントのスタイルと形式の保持

正確なテキスト表現のためにフォント スタイルと書式を維持し、Python および .NET での汎用性を高めます。

ライブコードサンプル

シンプルさを体験してください: わずか 3 行の Python コードで画像をテキストに変換します。

認識する準備ができています 認識する準備ができています ここにファイルをドロップするか、クリックして参照します *

* ファイルをアップロードするかサービスを使用することにより、次のことに同意したことになります。 利用規約 そして プライバシーポリシー.

認識結果
 

画像をテキストに変換する

他の例を見つける >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Python の .NET エンパワーメントを隅々まで

.NET 経由の Aspose.OCR for Python は、 .NET Framework 4.0 以降 をサポートする任意のプラットフォーム (ローカル マシン、Web など) 上でシームレスに動作します。サーバーとかクラウドとか。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

サポートされているファイル形式

Aspose.OCR for Python via .NET 事実上あらゆる[ファイル]を扱うことができます( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は、保存、データベースへのインポート、またはリアルタイムで分析できる最も一般的なファイルおよびデータ交換形式で返されます。

画像

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

バッチOCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

認識結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

.NET バックエンドを使用した Python のインストール

.NET 経由の Aspose.OCR for Python は、最小限の依存関係を持つ Python パッケージとして、または ダウンロード可能なファイル として提供されます。これをプロジェクトに簡単に インストール するだけで、サポートされている複数の言語でテキストを認識し、認識結果をさまざまな形式で保存できるようになります。

試用版ライセンスをリクエスト して、制限なく完全に機能する OCR アプリケーションの開発を開始します。

Python アプリケーション用の強力な OCR

私たちのライブラリは簡単に統合できるため、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームで Python アプリケーションをシームレスに実行できます。

28 の認識言語

当社の Python および .NET OCR API は、混合言語を含む、多数の言語と一般的なスクリプトを認識します。

言語検出をライブラリに任せるか、認識パフォーマンスと信頼性を向上させるために自分で言語を定義します。

  • 拡張ラテン語 アルファベット: クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語。
  • キリル文字 アルファベット: ベラルーシ語、ブルガリア語、カザフ語、ロシア語、セルビア語、ウクライナ語。
  • 中国語: 6,000 文字以上。
  • ヒンディー語

強力な処理フィルター

光学式文字認識の精度と信頼性は、元の画像の品質に大きく依存します。 .NET 経由の Aspose.OCR for Python は、OCR エンジンに送信される前に画像を強化する完全自動および手動の画像処理フィルターを多数提供します。

  • 水平に対してわずかな角度で配置された画像を自動的にまっすぐに補正します。
  • 著しく歪んだ画像を手動で回転します。
  • 汚れ、シミ、傷、まぶしさ、不要なグラデーション、その他のノイズを自動的に除去します。
  • 画像のコントラストを自動的に調整します。
  • 画像を自動的にアップスケールするか、手動でサイズを変更します。
  • 画像を白黒またはグレースケールに変換します。
  • 画像の色を反転して、明るい部分が暗く表示され、暗い部分が明るく表示されます。
  • 画像内の文字を太くします。
  • 文字のエッジを残したまま、ノイズの多い画像をぼかします。
  • ページの湾曲をまっすぐにし、ページ写真のカメラレンズの歪みを修正します。

特定のドキュメントタイプに最適化

Aspose.OCR for Python via .NET は、特定の種類の画像からテキストを最高の精度で抽出するために特別にトレーニングされたニューラル ネットワークを提供します。

内蔵スペルチェッカー

.NET 経由の Aspose.OCR for Python は高い認識精度を提供しますが、印刷欠陥、汚れ、または標準以外のフォントにより、特定の文字や単語が正しく認識されない可能性があります。認識結果をさらに向上させるには、スペル チェッカーを有効にすると、選択した認識言語に基づいてスペル エラーを検出し、自動的に修正します。

認識されたテキストに、一般的なスペル辞書に存在しない専門用語、略語、その他の単語が含まれている場合は、独自の単語リストを提供できます。

簡素化されたバッチ認識

当社の Python OCR API を使用すると、画像を 1 つずつ認識する作業から解放されます。さまざまなバッチ処理方法を使用して、1 回の呼び出しで複数の画像を認識します。

  • 複数ページの PDF、TIFF、DjVu ファイルの認識。
  • フォルダー内のすべてのファイルを認識します。
  • アーカイブ内のすべてのファイルを認識します。
  • リストからのすべてのファイルの認識。

Python の例を通じて学ぶ

.NET 経由の Aspose.OCR for Python は、Python で書かれた サンプル の配列を提供し、その機能をすぐに理解できるようにします。そして能力。 Python のビジネス ニーズを満たすカスタマイズされたソリューションを作成するための洞察を得ることができます。

特徴と機能

Aspose.OCR for Python via .NET Aspose.OCR for C++ の高度な機能を探索します。

Feature icon

写真OCR

スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。

Feature icon

検索可能なPDF

あらゆるスキャンを完全に検索可能でインデックス可能なドキュメントに変換します。

Feature icon

URL認識

画像をローカルにダウンロードせずに、URL から画像を認識します。

Feature icon

一括認識

複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。

Feature icon

任意のフォントとスタイル

すべての一般的な書体とスタイルのテキストを識別して認識します。

Feature icon

認識を微調整する

最良の認識結果が得られるように、すべての OCR パラメータを調整します。

Feature icon

スペルチェッカー

スペルミスの単語を自動的に修正することで結果を改善します。

Feature icon

画像内のテキストを検索する

一連の画像内のテキストまたは正規表現を検索します。

Feature icon

画像テキストを比較する

大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。

Python コードサンプル

コード サンプルを詳しく調べて、.NET 経由で Aspose.OCR for Python を Python アプリケーションにシームレスに統合します。

Python のインストールをマスターする

Aspose.OCR for Python は、Python Wheel または自己完結型のダウンロード可能なパッケージとして配布され、.NET 経由で簡単に配布できます。好みの Python 統合開発環境 (IDE) から直接、Python プロジェクトに統合することは、シームレスなプロセスです。インストールするだけで、OCR 機能の全範囲を活用し、認識結果をさまざまな形式で保存する準備が整います。

インストール後、.NET 経由で Aspose.OCR for Python の使用をすぐに開始できます。ただし、一定の制限があります。一時ライセンスにより、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後の段階で .NET 経由で Aspose.OCR for Python を購入するかどうかについて情報に基づいた決定を下すことができます。

ライセンスをロードする

lic = License()
lic.set_license(self.licPath)

写真上のテキストを認識する

.NET を介して Aspose.OCR for Python のコンテンツからテキストを読み取ることは、ユニバーサル accept() メソッドを呼び出すのと同じくらい簡単です。

写真をテキストに変換する - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python ユニバーサル コンバーター

当社の API は、PDF ドキュメント、JPEG、PNG、TIFF、GIF、BMP 画像、さらには DjVu ファイルなど、スキャナー、カメラ、スマートフォンからあらゆる画像を適切に読み取ります。複数ページの PDF ドキュメント、TIFF、DjVu 画像を完全にサポートしているため、多用途性が保証されます。 URL を介して Web から画像を提供することもできます。

認識結果は、プレーン テキスト、PDF、Microsoft Word、Microsoft Excel、JSON、XML などの一般的なドキュメントおよびデータ交換形式で返されます。

PDF を認識し、結果をさまざまな出力形式で保存する - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Python でのリソースの最適化

光学式文字認識にはリソースが必要です。当社の API は、時間、価格、品質の古典的な 3 つのバランスをとる柔軟な方法を提供します。

  • 完全な認識と高速認識のどちらかを選択します。
  • 認識用に割り当てられるスレッドの数を指定するか、ライブラリがプロセッサ コアの数に合わせて自動的にスケーリングできるようにします。
  • 計算を .NET バックエンドにオフロードすることで CPU を解放します。

高速認識 - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

単線を認識する

画像が既に 1 行のテキストにトリミングされている場合は、自動修正、コンテンツ構造の検出、その他のリソースを消費する手順を行わずに、可能な限り高速なモードで画像を認識できます。通常の認識プロセスよりも最大 7 倍高速に OCR を高速化できます。

画像上の単一行のテキストを認識する - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)