C++ 経由で Python に Aspose.OCR を選択する理由

C++ 経由で Aspose.OCR for Python を使用して OCR 機能を強化します。この機能満載のライブラリは、最小限のコードで OCR を Python アプリケーションにシームレスに統合します。ラテン文字、キリル文字、中国語文字を含む 28 の言語をサポートし、卓越した速度と精度を体験してください。スキャンした文書やスマートフォンの写真から、スクリーンショットやスキャンした PDF まで、さまざまな画像を認識します。高度な前処理フィルターは、画像の回転、歪み、ノイズの多い画像などの課題に対処し、GPU 処理を活用して最適なパフォーマンスを保証します。

Illustration ocr

迅速かつ正確な OCR

C++ テクノロジーを介した最先端の Python を使用して、迅速かつ正確な OCR 結果を実現します。

多言語認識

28 言語のテキストを認識し、C++ 統合により Python アプリケーションの多用途性を確保します。

包括的な画像サポート

C++ 経由で Python を使用して、スキャナー、カメラ、スマートフォンからの画像を簡単に処理します。

正確な漢字認識

C++ を介して Python プロジェクト内の 6,000 を超える漢字を正確に認識します。

フォントのスタイルと書式を維持する

フォント スタイルと書式を保持して、C++ 経由で Python アプリケーションで認識されたテキストを正確に表現します。

ライブコードサンプル

わずか 3 行のコードで画像からのテキスト認識を開始します。シンプルさを体験してください!

認識する準備ができています 認識する準備ができています ここにファイルをドロップするか、クリックして参照します *

* ファイルをアップロードするかサービスを使用することにより、次のことに同意したことになります。 利用規約 そして プライバシーポリシー.

認識結果
 

画像をテキストに変換する

他の例 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);

Python アプリケーション向けの OCR 統合

Aspose.OCR for Python via C++ は、デスクトップ Windows、Windows Server、macOS、Linux のいずれであっても、 C++ をサポートするあらゆるプラットフォームとシームレスに統合します。 、またはクラウド。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

サポートされているファイル形式

Aspose.OCR for Python via C++ 事実上あらゆる[ファイル]を扱うことができます( https://docs.aspose.com/ocr/python-cpp/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は、保存、データベースへのインポート、またはリアルタイムで分析できる最も一般的なファイルおよびデータ交換形式で返されます。

画像

  • JPEG
  • PNG
  • TIFF
  • BMP

バッチOCR

  • Multi-page PDF
  • ZIP
  • Folder

認識結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • RTF
  • JSON
  • XML

C++ 経由で Python を簡単にインストール

C++ 経由の Python 用 Aspose.OCR は、Python パッケージとして、または依存関係を最小限に抑えた ダウンロード可能なファイル として提供されます。これをプロジェクトに簡単に インストール するだけで、サポートされている複数の言語でテキストを認識し、認識結果をさまざまな形式で保存できるようになります。

試用版ライセンスをリクエスト して、制限なく完全に機能する OCR アプリケーションの開発を開始します。

Python アプリケーションの C++ バックエンド統合

当社のライブラリは C++ バックエンドとシームレスに統合されており、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームで Python アプリケーションをシームレスに実行できるようになります。

28 の認識言語

混合言語を含む、さまざまな言語とスクリプトのサポート:

ライブラリに言語を検出させるか、言語を定義してパフォーマンスを向上させることで、認識を最適化します。

  • 拡張ラテン語 アルファベット: クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語。
  • キリル文字 アルファベット: ベラルーシ語、ブルガリア語、カザフ語、ロシア語、セルビア語、ウクライナ語。
  • 中国語: 6,000 文字以上。
  • ヒンディー語

主な特長

Aspose.OCR for Python via C++ C++ 経由で Python 用の Aspose.OCR の高度な機能を探索します。

Feature icon

写真OCR

スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。

Feature icon

検索可能なPDF

あらゆるスキャンを完全に検索可能でインデックス可能なドキュメントに変換します。

Feature icon

URL認識

画像をローカルにダウンロードせずに、URL から画像を認識します。

Feature icon

一括認識

複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。

Feature icon

任意のフォントとスタイル

すべての一般的な書体とスタイルのテキストを識別して認識します。

Feature icon

認識を微調整する

最良の認識結果が得られるように、すべての OCR パラメータを調整します。

Feature icon

スペルチェッカー

スペルミスの単語を自動的に修正することで結果を改善します。

Feature icon

画像内のテキストを検索する

一連の画像内のテキストまたは正規表現を検索します。

Feature icon

画像テキストを比較する

大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。

Feature icon

認識範囲を制限する

OCR エンジンが検索する文字のセットを制限します。

Feature icon

画像欠陥の検出

画像内で問題がある可能性のある領域を自動的に検出します。

Feature icon

領域を認識する

すべてのテキストではなく、画像の特定の領域のみを検索して読み取ります。

Python コードサンプル

C++ 経由で Aspose.OCR for Python をアプリケーションにシームレスに統合するコード サンプルを見つけてください。

簡単な取り付け

Aspose.OCR for Python は、軽量の Python パッケージ、または最小限の依存関係を持つダウンロード可能なファイルとして、C++ 経由で簡単に配布できます。これを Python からプロジェクトに直接統合すると、完全な OCR 機能を利用して、認識結果をさまざまな形式で保存する準備が整います。

インストール後、C++ 経由で Python 用 Aspose.OCR の使用をすぐに開始します。一定の制限はありますが。一時ライセンスを使用すると、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後で C++ 経由で Python 用の Aspose.OCR を購入するかどうかを十分な情報に基づいて決定できるようにします。

文書領域の検出

テキスト文書のイメージスキャンまたは写真は、多くの場合、テキストの段落、表、イラスト、数式などを含む複数のコンテンツブロックで構成されます。効果的な OCR を実現するには、ページ上のこれらの関心領域を正確かつ正確に認識することが重要です。この極めて重要なプロセスは文書領域検出として知られており、個別のコンテンツ領域の識別、編成、分類が含まれます。

Aspose.OCR はいくつかのドキュメント領域検出アルゴリズムを提供しており、特定のコンテンツに最適なものを選択できます。

さまざまな画像コンテンツのセットアップ - Python OCR

settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE

input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)

さまざまな出力形式

OCR for C++ は認識結果を複数の形式 (プレーン テキスト、PDF、Microsoft Word、Microsoft Excel、JSON、XML) で保存できるため、共有、データベースへの保存、表示、分析が可能です。 {index-content-python-cpp.code_samples.item3.content2}

認識結果を JSON に保存する - Python

recognize_result_txt 
    = asposeocr.AsposeOCRSerializeResult(
      recognize_result, 
      asposeocr.ExportFormat.json)