Aspose.OCR for C ++は、 5行のコードで光学式文字認識機能を使用してアプリケーションを拡張します。ニューラルネットワークと機械学習での経験は、ラテン文字とキリル文字、および中国語に基づく26の言語をサポートする優れたパフォーマンスと精度を備えたOCRライブラリに変換されました。 OCR APIは、スキャンされた画像、スマートフォンの写真、スクリーンショット、画像の領域、スキャンされたPDFを認識し、最も一般的なドキュメントおよびデータ交換形式で結果を返します。それは完全にオフラインであり、動作するためにインターネット接続を必要としません。 APIは、開始するのに最小限の労力と習得するための浅い学習曲線を必要とします。すべての前処理、スキュー補正、ノイズ除去、言語検出、マルチスレッド、およびその他の複雑なタスクは自動的に実行されますが、ハードケースに対処するように調整することができます。
高度なC++OCRAPI機能
画像からテキストを抽出し、検索可能なPDFを作成します
スキャナーまたはカメラから取得できるすべての画像をサポートします
拡張ラテン文字とキリル文字を読み取ります
6,000以上の漢字を認識します
一般的なすべての書体と書式を検出して認識します
認識前に画像を前処理します
画像全体または選択した領域のみを処理します
回転した画像、歪んだ画像、ノイズの多い画像をサポート
フォルダまたはアーカイブ内のすべての画像のバッチ認識
Webリンクとして提供された画像を認識します
スペルミスのある単語を検索して自動的に修正します
JSONとして認識結果を取得する
使いやすい
あなたはまだC++OCRが難しいと思いますか?私たちのライブラリでは、画像を認識して結果を表示するために必要なコードは5行だけです。このコードを試して、自分の目で確かめてください。
5行の画像からテキストへ-C++
// 画像パスを提供する
std::string image_path = "../Data/Source/sample.png";
// 結果のバッファーを準備します
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// 魔法をかける
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);
// 認識結果を表示する
std::wcout << buffer << L"\n";
26認識言語
OCR APIは、多数の言語と、混合言語のテキストを含むすべての一般的な書き込みスクリプトを認識できます。
- 拡張ラテンアルファベット:クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語。
- キリル文字:ベラルーシ語、ブルガリア語、カザフスタン語、ロシア語、セルビア語、ウクライナ語。
- 中国語:6,000文字以上。
言語検出をライブラリに任せるか、言語を自分で定義して、認識のパフォーマンスと信頼性を高めることができます。
バッチ処理
OCR APIは、1回の呼び出しで複数の画像を認識できるさまざまなバッチ処理メソッドを提供することにより、すべての画像を1つずつ認識しないようにします。
- 複数ページのPDFおよびTIFFファイルの認識。
- フォルダ内のすべてのファイルの認識。
- アーカイブ内のすべてのファイルの認識。
ZIPアーカイブを認識する-C++
// アーカイブパスを提供する
std::string archive_path = "book.zip";
// 結果のバッファーを準備します
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// RecognitionSettingsオブジェクトをデフォルト値で初期化します
RecognitionSettings settings;
// 認識
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);
フォーマットを保持する
OCRライブラリは、Arial、Times New Roman、Courier New、Tahoma、Calibriなどの一般的なすべての書体を通常の太字および斜体のスタイルで読み取り、OCR結果の書式を慎重に保持します。認識結果を行に分割し、ページ内のテキスト領域を検出することもできます。
写真を認識する
OCRアプリケーションの普及は、通常、スキャナーがほとんどのユーザーにとって一般的ではないという事実によって止められています。 OCRライブラリには、暗い画像、回転した画像、歪んだ画像、ノイズの多い画像を処理できる強力な画像前処理フィルターが組み込まれています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真でも確実に認識できます。前処理と画像補正のほとんどは自動的に行われるため、困難な場合にのみ介入する必要があります。
スキュー補正のカスタム角度を設定-C++
// 元の画像
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };
// 結果のバッファーを準備します
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// スキュー角度を調整する
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;
// 画像を認識する
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
スペルチェック
OCRは信頼できる結果を生成しますが、ほこりや印刷の欠陥により、一部の記号が正しく認識されない場合があります。 OCR APIには、スペルミスのある単語を自動的に置き換えるスペルチェッカーが組み込まれており、認識結果を手動で修正する必要がありません。