C ++を介してPython用のAspose.ocrを選択する理由

C ++を介してPython用のAspose.ocrでOCR機能を強化します。この機能が満載のライブラリは、最小限のコードでOCRをPythonアプリケーションにシームレスに統合します。ラテン語、キリル語、アラビア語、ペルシャ語、インド語、中国語のスクリプトを含む140以上の言語をサポートする例外的な速度と正確さを体験してください。スキャンされたドキュメントやスマートフォンの写真からスクリーンショットやスキャンされたPDFまで、さまざまな画像を認識します。高度な前処理フィルターは、回転、歪んだ、ノイズの多い画像などの課題を処理し、GPU処理を活用することで最適なパフォーマンスを確保します。

Illustration ocr

迅速かつ正確なOCR

C ++テクノロジーを介して最先端のPythonで迅速かつ正確なOCR結果を達成します。

多言語認識

140を超える言語でテキストを認識し、C ++統合を介してPythonアプリケーションの汎用性を確保します。

包括的な画像サポート

C ++を介してPythonを使用して、スキャナー、カメラ、スマートフォンから画像を簡単に処理します。

正確な漢字認識

C ++を介してPythonプロジェクトで6,000を超える漢字を正確に認識しています。

フォントスタイルとフォーマットを維持します

フォントスタイルを保持し、C ++を介してPythonアプリケーションで認識されたテキストを正確に表現するためのフォーマットを保持します。

ライブコードサンプル

わずか3行のコードで画像からテキスト認識を開始します。シンプルさを体験してください!

認識する準備ができました 認識する準備ができました ここにファイルをドロップするか、クリックして閲覧 *

*ファイルをアップロードするか、サービスを使用することにより、私たちに同意することにより 利用規約 そして プライバシーポリシー.

認識結果
 

画像をテキストに変換します

その他の例 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Extract text from image
string result = recognitionEngine.RecognizeImage("<file name>");
// Display the recognition result
Console.WriteLine(result);

あなたの好みを選択してください

ニーズに合った適切なライブラリを選択してください。利用可能なAPIとその機能を調査して、最も効率的なソリューションを選択します。

汎用性

Python via .NET

コードの簡単な開発、読みやすさ、保守性
最も機能を誇っていて、最も頻繁な更新を受け取ります
全体的な速度は他のプラットフォームよりも少し遅くなる可能性があります

均一

Python via Java

任意のプラットフォームで同じライブラリを使用します
任意のデバイスでアプリケーションをシームレスに実行します
Javaランタイム環境(JRE)バージョン8以降が必要です

パフォーマンス

Python via C++

プラットフォームに関係なく、可能な限り最速の速度
リソース管理に対する多くの制御
経験豊富な開発者を対象としています

PythonアプリケーションのOCR統合

Python for C ++を介してPython用のAspose.ocrは、[c ++](https://docsops.com/ocr/python-cpp/system-requirements/)をサポートするプラットフォームとシームレスに統合します。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

サポートされているファイル形式

Aspose.OCR for Python via C++ [ファイル]で動作することができます( https://docs.aspose.com/ocr/python-cpp/supported-file-formats/ ) スキャナーやカメラから入手できます。認識結果は、保存したり、データベースにインポートしたり、リアルタイムで分析されたりできます。

画像

  • JPEG
  • PNG
  • TIFF
  • BMP

バッチOCR

  • Multi-page PDF
  • ZIP
  • Folder

認識結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • RTF
  • JSON
  • XML

C ++経由のPythonの簡単なインストール

C ++経由のPython用Asophe.ocrは、Pythonパッケージとして、または[ダウンロード可能なファイル](https://releases.aspose.com/ocr/python-cpp/)として配信されます。簡単に[インストール](https://docs.aspose.com/ocr/python-cpp/installation/)プロジェクトに参加すると、複数のサポート言語でテキストを認識し、さまざまな形式で認識結果を保存する準備が整います。

[トライアルライセンスを要求](https://purchase.aspose.com/temporary-license)完全に機能的なOCRアプリケーションの開発を制限せずに開始します。

Pythonアプリケーション用のC ++バックエンド統合

ライブラリは、C ++バックエンドとシームレスに統合されており、Pythonアプリケーションは、デスクトップWindows、Windows Server、MacOS、Linux、The Cloudのプラットフォームでシームレスに実行できます。

140以上の認識言語

混合言語を含む多様な言語とスクリプトのサポート:

ライブラリに言語を検出できるようにすることで認識を最適化するか、パフォーマンスを向上させるためにそれを定義します。

  • 拡張ラテン語アルファベット:英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語など。
  • キリル語アルファベット:ロシア語、ウクライナ人、カザフ、セルビア語、ベラルーサン、ブルガリア語。
  • アラビア語、ペルシャ語、ウルドゥー語。
  • ヒンディー語、マラーティー語、ボジプリなどを含む中国とデヴァナガリの脚本。

重要な機能

Aspose.OCR for Python via C++ C ++を介してPython用のAspose.ocrの高度な機能を探索します。

Feature icon

写真OCR

スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。

Feature icon

検索可能なPDF

スキャンを完全に検索可能でインデックス可能なドキュメントに変換します。

Feature icon

URL認識

ローカルにダウンロードせずにURLから画像を認識します。

Feature icon

バルク認識

マルチページドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。

Feature icon

フォントとスタイル

すべての人気のある書体とスタイルでテキストを特定して認識します。

Feature icon

微調整の認識

最良の認識結果については、すべてのOCRパラメーターを調整します。

Feature icon

スペルチェッカー

間違いのある単語を自動的に修正することにより、結果を改善します。

Feature icon

画像でテキストを見つけます

一連の画像内でテキストまたは正規表現を検索します。

Feature icon

画像テキストを比較します

ケースとレイアウトに関係なく、2つの画像のテキストを比較します。

Feature icon

認識範囲を制限します

OCRエンジンが探す文字のセットを制限します。

Feature icon

画像の欠陥を検出します

画像の潜在的に問題のある領域を自動的に見つけます。

Feature icon

領域を認識します

すべてのテキストではなく、画像の特定の領域のみを見つけて読み取ります。

Pythonコードサンプル

コードサンプルを発見して、C ++を介してPython用のAspose.ocrをアプリケーションにシームレスに統合します。

楽なインストール

軽量のPythonパッケージまたは最小限の依存関係を備えたダウンロード可能なファイルとして、C ++を介してPython用のAspose.ocrとして、簡単な配信を保証します。 Pythonからプロジェクトに直接統合すると、完全なOCR機能を活用し、認識結果をさまざまな形式で保存する準備ができています。一時的なライセンスにより、すべての試用版の制限が30日間削除されます。この期間を利用して、完全に機能するOCRアプリケーションの開発を開始し、後でC ++を介してPythonのAspose.ocrを購入することについて情報に基づいた決定を下すことができます。

ドキュメント領域の検出

テキストドキュメントの画像スキャンまたは写真は、多くの場合、テキストの段落、表、イラスト、式などを含む複数のコンテンツブロックを含むことがよくあります。有効なOCRにとって、これらの関心のある領域をページ上のこれらの領域を正確に正確に認識することが重要です。この重要なプロセスは、異なるコンテンツ領域の識別、組織、および分類を含むドキュメントエリア検出として知られています。

Aspose.ocrはいくつかのドキュメント領域検出アルゴリズムを提供し、特定のコンテンツに最適なものを選択できるようにします。

バラソルイメージコンテンツのセットアップ-Python OCR

settings = asposeocr.RecognitionSettings()
settings.areasMode = asposeocr.DetectAreasMode.TABLE
# DetectAreasMode.DOCUMENT / PHOTO / CURVED_TEXT / TABLE / COMBINE

input_data = [asposeocr.AsposeOCRInput()]
input_data[0].url = 'path/to/file'
recognize_result = asposeocr.AsposeOCRRecognize(input_data, settings)

さまざまな出力形式

C ++のOCRは、認識結果を複数の形式で保存できるため、データベースに共有、保存、表示、または分析できます。プレーンテキスト、PDF、Microsoft Word、Microsoft Excel、JSON、およびXML。 {index-content-python-cpp.code_samples.item3.content2}

JSON -Pythonに認識結果を保存します

recognize_result_txt 
    = asposeocr.AsposeOCRSerializeResult(
      recognize_result, 
      asposeocr.ExportFormat.json)