C++ 経由で Python に Aspose.OCR を選択する理由

C++ 経由で Aspose.OCR for Python を使用して OCR 機能を強化します。この機能満載のライブラリは、最小限のコードで OCR を Python アプリケーションにシームレスに統合します。ラテン語、キリル文字、アラビア語、ペルシア語、インド語、中国語の文字を含む 130 以上の言語をサポートし、卓越した速度と精度を体験してください。スキャンした文書やスマートフォンの写真から、スクリーンショットやスキャンした PDF まで、さまざまな画像を認識します。高度な前処理フィルターは、回転、歪み、ノイズのある画像などの課題に対処し、GPU 処理を活用して最適なパフォーマンスを保証します。

Illustration ocr

迅速かつ正確な OCR

C++ テクノロジーを介した最先端の Python を使用して、迅速かつ正確な OCR 結果を実現します。

多言語認識

130 を超える言語のテキストを認識し、C++ 統合を通じて Python アプリケーションの汎用性を確保します。

包括的な画像サポート

C++ 経由で Python を使用して、スキャナー、カメラ、スマートフォンからの画像を簡単に処理します。

正確な漢字認識

C++ を介して Python プロジェクト内の 6,000 を超える漢字を正確に認識します。

フォントのスタイルと書式を維持する

フォント スタイルと書式を保持して、C++ 経由で Python アプリケーションで認識されたテキストを正確に表現します。

ライブコードサンプル

わずか 3 行のコードで画像からのテキスト認識を開始します。シンプルさを体験してください!

認識する準備ができています 認識する準備ができています ここにファイルをドロップするか、クリックして参照します *

* ファイルをアップロードするかサービスを使用することにより、次のことに同意したことになります。 利用規約 そして プライバシーポリシー.

認識結果
 

画像をテキストに変換する

他の例 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);

好みを選択してください

ニーズに合わせて適切なライブラリをお選びください。利用可能な API とその機能を調べて、最も効率的なソリューションを選択します。

多用途性

Python via .NET

コードの開発、読みやすさ、保守の容易さ
最も多くの機能を誇り、最も頻繁にアップデートを受け取ります
全体的な速度は他のプラットフォームより少し遅いかもしれません

均一

Python via Java

どのプラットフォームでも同じライブラリを使用
あらゆるデバイスでアプリケーションをシームレスに実行
Java ランタイム環境 (JRE) バージョン 8 以降が必要です

パフォーマンス

Python via C++

プラットフォームに関係なく可能な限り最速の速度
リソース管理の高度な制御
経験豊富な開発者を対象としています

Python アプリケーション向けの OCR 統合

Aspose.OCR for Python via C++ は、デスクトップ Windows、Windows Server、macOS、Linux のいずれであっても、 C++ をサポートするあらゆるプラットフォームとシームレスに統合します。 、またはクラウド。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

サポートされているファイル形式

Aspose.OCR for Python via C++ 事実上あらゆる[ファイル]を扱うことができます( https://docs.aspose.com/ocr/python-cpp/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は、最も一般的なファイルおよびデータ交換形式で返され、保存、データベースへのインポート、またはリアルタイムでの分析が可能です。

画像

  • JPEG
  • PNG
  • TIFF
  • BMP

バッチOCR

  • Multi-page PDF
  • ZIP
  • Folder

認識結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • RTF
  • JSON
  • XML

C++ 経由で Python を簡単にインストール

C++ 経由の Python 用 Aspose.OCR は、Python パッケージとして、または依存関係を最小限に抑えた ダウンロード可能なファイル として提供されます。これをプロジェクトに簡単に インストール するだけで、サポートされている複数の言語でテキストを認識し、認識結果をさまざまな形式で保存できるようになります。

試用版ライセンスをリクエスト して、制限なく完全に機能する OCR アプリケーションの開発を開始します。

Python アプリケーションの C++ バックエンド統合

当社のライブラリは C++ バックエンドとシームレスに統合されており、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームで Python アプリケーションをシームレスに実行できるようになります。

130 以上の認識言語

混合言語を含む、さまざまな言語とスクリプトのサポート:

ライブラリに言語を検出させるか、言語を定義してパフォーマンスを向上させることで、認識を最適化します。

  • 拡張ラテン語 アルファベット: 英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、その他 80 以上。
  • キリル文字 アルファベット: ロシア語、ウクライナ語、カザフ語、セルビア語、ベラルーシ語、ブルガリア語。
  • アラビア語、ペルシア語、ウルドゥー語。
  • 中国語およびデーヴァナーガリー文字(ヒンディー語、マラーティー語、ボージプリ語などを含む)。

主な特長

Aspose.OCR for Python via C++ C++ 経由で Python 用の Aspose.OCR の高度な機能を探索します。

Feature icon

写真OCR

スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。

Feature icon

検索可能なPDF

あらゆるスキャンを完全に検索可能でインデックス可能なドキュメントに変換します。

Feature icon

URL認識

画像をローカルにダウンロードせずに、URL から画像を認識します。

Feature icon

一括認識

複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。

Feature icon

任意のフォントとスタイル

すべての一般的な書体とスタイルのテキストを識別して認識します。

Feature icon

認識を微調整する

最良の認識結果が得られるように、すべての OCR パラメータを調整します。

Feature icon

スペルチェッカー

スペルミスの単語を自動的に修正することで結果を改善します。

Feature icon

画像内のテキストを検索する

一連の画像内のテキストまたは正規表現を検索します。

Feature icon

画像テキストを比較する

大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。

Feature icon

認識範囲を制限する

OCR エンジンが検索する文字のセットを制限します。

Feature icon

画像欠陥の検出

画像内で問題がある可能性のある領域を自動的に検出します。

Feature icon

領域を認識する

すべてのテキストではなく、画像の特定の領域のみを検索して読み取ります。

Python コードサンプル

C++ 経由で Aspose.OCR for Python をアプリケーションにシームレスに統合するコード サンプルを見つけてください。

簡単な取り付け

Aspose.OCR for Python は、軽量の Python パッケージ、または最小限の依存関係を持つダウンロード可能なファイルとして、C++ 経由で簡単に配布できます。これを Python からプロジェクトに直接統合すると、完全な OCR 機能を活用し、認識結果をさまざまな形式で保存する準備が整います。

インストール後、C++ 経由で Python 用 Aspose.OCR の使用を直ちに開始します。一定の制限はありますが。一時ライセンスでは、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後で C++ 経由で Python 用の Aspose.OCR を購入するかどうかを十分な情報に基づいて決定できるようにします。

文書領域の検出

テキスト文書のイメージスキャンまたは写真は、多くの場合、テキストの段落、表、イラスト、数式などを含む複数のコンテンツブロックで構成されます。効果的な OCR には、ページ上のこれらの関心領域を正確かつ正確に認識することが重要です。この極めて重要なプロセスは文書領域検出として知られており、個別のコンテンツ領域の識別、編成、分類が含まれます。

Aspose.OCR はいくつかのドキュメント領域検出アルゴリズムを提供しており、特定のコンテンツに最適なものを選択できます。

さまざまな画像コンテンツのセットアップ - Python OCR

settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE

input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)

さまざまな出力形式

OCR for C++ は認識結果を複数の形式 (プレーン テキスト、PDF、Microsoft Word、Microsoft Excel、JSON、XML) で保存できるため、共有、データベースへの保存、表示、分析が可能です。 {index-content-python-cpp.code_samples.item3.content2}

認識結果を JSON に保存する - Python

recognize_result_txt 
    = asposeocr.AsposeOCRSerializeResult(
      recognize_result, 
      asposeocr.ExportFormat.json)