Aspose.OCR for .NETは、光学式文字認識のための強力でありながら使いやすく、費用対効果の高いAPIです。これを使用すると、複雑な数学、ニューラルネットワーク、およびその他の技術的な詳細を気にすることなく、5行未満のコードで.NETアプリケーションにOCR機能を追加できます。機械学習テクノロジーでの経験と長年の開発により、ラテン文字とキリル文字、および中国語に基づく26の言語をサポートする優れた速度と精度のOCRエンジンが実現しました。 OCR APIは、スキャンされた画像、スマートフォンの写真、スクリーンショット、画像の領域、スキャンされたPDFを認識し、最も一般的なドキュメントおよびデータ交換形式で結果を返します。さまざまな前処理フィルターを使用すると、回転した画像、歪んだ画像、ノイズの多い画像を認識できます。リソースを大量に消費する計算タスクをGPUに転送することで、認識パフォーマンスとシステム負荷をさらに向上させることができます。
Aspose.OCRfor.NETの機能と機能
画像とPDFをテキストに変換します
スキャナーまたはカメラから取得できるすべての画像形式をサポートします
ラテン文字とキリル文字に基づく言語を読み取ります
6,000以上の漢字を認識します
人気のあるすべての書体を検出して認識します
フォントスタイルとフォーマットを注意深く保持します
画像全体または選択した領域のみを処理します
回転した画像、歪んだ画像、ノイズの多い画像をサポート
フォルダまたはアーカイブ内のすべての画像のバッチ認識
Webリンクとして提供された画像を認識します
スペルミスのある単語を検索して自動的に修正します
他のAspose製品と完全に互換性があります
インストールが簡単
Aspose.OCR for .NETは、軽量のNuGetパッケージとして、または依存関係が最小限のダウンロード可能なファイルとして配布されます。プロジェクトにインストールするだけで、サポートされている言語のテキストを認識し、サポートされている形式の認識結果を保存する準備が整います。
制限や制限なしに完全に機能するOCRアプリケーションの構築を開始するには、一時ライセンスを要求してください。
使いやすい
画像を認識して結果を表示するには、 3行のコードが必要です。はい、それは本当に簡単です!
3行の画像からテキストへ-C#
// OCRエンジンを初期化する
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// 画像をテキストに認識する
string result = recognitionEngine.RecognizeImage("sample.jpg");
// 認識結果を表示する
Console.WriteLine(result);
クロスプラットフォーム
ライブラリは.NETStandard2.0を完全にサポートしています。これは、アプリケーションがデスクトップWindows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームで実行できることを意味します。
26認識言語
OCR APIは、多数の言語と、混合言語のテキストを含むすべての一般的な書き込みスクリプトを認識できます。
- 拡張ラテンアルファベット:クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語。
- キリル文字:ベラルーシ語、ブルガリア語、カザフスタン語、ロシア語、セルビア語、ウクライナ語。
- 中国語:6,000文字以上。
言語検出をライブラリに任せるか、言語を自分で定義して、認識のパフォーマンスと信頼性を高めることができます。
写真を認識する
OCRアプリケーションの最大の障壁は、スキャナーがエンドユーザーにとって一般的ではないことです。 APIには、回転した画像、歪んだ画像、ノイズの多い画像を処理できる強力な画像前処理フィルターが組み込まれています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真でも確実に認識できます。前処理と画像補正のほとんどは自動的に行われるため、困難な場合にのみ介入する必要があります。
自動画像補正を適用する-C#
// OCRエンジンを初期化する
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// 自動スキュー計算とコントラストを有効にする
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true,
AutoSkew = true
};
// 画像を認識する
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);
ユニバーサルコンバーター
APIは、スキャナー、カメラ、スマートフォンから取得できるあらゆる画像を文字通り読み取ることができます。PDFドキュメント、JPEG、PNG、TIFF、GIF、BMP画像、さらにはDjVuファイルです。複数ページのPDFドキュメント、TIFFおよびDjVu画像が完全にサポートされています。 URLを介してWebから画像を提供することもできます。
認識結果は、最も一般的なドキュメントおよびデータ交換形式(プレーンテキスト、PDF、Microsoft Word、Microsoft Excel、JSON、およびXML)で返されます。
PDFを認識し、結果をJSONに保存します-C#
// OCRエンジンを初期化する
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// スキャンしたPDFからすべてのページを認識します
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());
// 各ページをJSONとして出力
foreach(var page in pages)
{
Console.WriteLine(page.GetJson());
}
リソースの最適化
光学式文字認識は、リソースを大量に消費するプロセスです。 APIは、従来の時間-価格-品質のトライアドでバランスを取るための非常に柔軟な方法を提供します。
- 完全な認識と高速認識のどちらかを選択します。
- 認識用に割り当てられたスレッドの数を指定するか、ライブラリがプロセッサコアの数に自動的にスケーリングできるようにします。
- 計算をGPUにオフロードして、CPUを解放します。
高速認識-C#
// OCRエンジンを初期化する
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// 最速モードで画像を認識する
string result = recognitionEngine.RecognizeImageFast("sample.jpg");
スペルチェック
OCRは信頼できる結果を生成しますが、ほこりや印刷の欠陥により、一部の記号が正しく認識されない場合があります。 OCR APIには、スペルミスのある単語を自動的に置き換えるスペルチェッカーが組み込まれており、認識結果を手動で修正する必要がありません。
スペルチェックの認識結果-C#
// OCRエンジンを初期化する
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// 自動コントラストを有効にする
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true
};
// 画像を認識する
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);
// スペルミスのある単語を修正する
string text = result.GetSpellCheckCorrectedText();
バッチ処理
OCR APIは、1回の呼び出しで複数の画像を認識できるさまざまなバッチ処理メソッドを提供することにより、すべての画像を1つずつ認識しないようにします。
- 複数ページのPDF、TIFF、およびDjVuファイルの認識。
- フォルダ内のすべてのファイルの認識。
- アーカイブ内のすべてのファイルの認識。
- リストからのすべてのファイルの認識。
例で学ぶ
Aspose.OCR for .NETには、C#で記述された多数の例が付属しており、その機能と機能をすばやく理解し、ビジネスニーズに合ったソリューションを作成するためのアイデアを得ることができます。