Aspose.OCR for Javaを使用すると、画像、スクリーンショット、画像の特定の領域からテキストを抽出し、Javaをサポートする任意のプラットフォームでスキャンしたファイルから検索可能なPDFを作成できます。強力でありながら使いやすいAPIを備えているため、複雑なOCRタスクでも10行未満のコードで済みます。数式や機械学習を操作する必要はありません。ライブラリがすべての技術的な詳細を処理し、ラテン文字とキリル文字、および中国語に基づいて26の言語で信頼できる結果を生成します。 OCR APIは、スキャンされた画像、スマートフォンの写真、スクリーンショット、画像の領域、スキャンされたPDFを処理し、最も一般的なドキュメント形式で結果を返します。複数のCPUコアに計算を分散し、リソースを大量に消費するタスクをGPUにオフロードすることで、認識速度、精度、パフォーマンスをさらに向上させることができます。
Aspose.OCRforJavaの機能と機能
スキャンした画像やPDFでフォーマットされたテキストを認識します
スキャナーまたはカメラから取得できるすべてのファイル形式をサポートします
ラテン文字とキリル文字を読みます
6,000以上の漢字を認識します
人気のあるすべての書体を検出して認識します
フォントスタイルとフォーマットを注意深く保持します
画像全体または選択した領域のみを処理します
回転した画像、歪んだ画像、ノイズの多い画像をサポート
フォルダまたはアーカイブ内のすべての画像のバッチ認識
Webリンクとして提供された画像を認識します
スペルミスのある単語を検索して自動的に修正します
他のAspose製品との100%の互換性
インストールが簡単
簡単なインストール手順に従って、 Mavenベースのプロジェクトから直接Aspose.OCRforJavaを使用できます。
制限や制限なしに完全に機能するOCRアプリケーションの構築を開始するには、一時ライセンスを要求してください。
$Easy to Use$
画像認識には数行のコードが必要です。文字通り。それは本当にとても簡単です-自分で試してみてください:
7行の画像からテキストへ-Java
// OCRAPIのインスタンスを作成します
AsposeOCR api = new AsposeOCR();
try {
// 画像を認識する
String result = api.RecognizePage(imagePath);
// 認識結果を表示する
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// エラー処理
e.printStackTrace();
}
26認識言語
OCR APIは、多数の言語と、混合言語のテキストを含むすべての一般的な書き込みスクリプトをサポートしています。組み込みのスペルチェッカーは、スペルミスのある単語を自動的に置き換え、認識結果を手動で修正する手間を省きます。
- 拡張ラテンアルファベット:クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語。
- キリル文字:ベラルーシ語、ブルガリア語、カザフスタン語、ロシア語、セルビア語、ウクライナ語。
- 中国語:6,000文字以上。
言語を指定して認識のパフォーマンスと信頼性を向上させたり、APIに言語を自動的に検出させたりすることができます。
フォーマットを保持する
OCR APIは、Arial、Times New Roman、Courier New、Tahoma、Calibriなどの一般的なすべての書体を通常の太字および斜体のスタイルで読み取り、OCR結果の書式を慎重に保持します。認識結果を行に分割し、ページ内のテキスト領域を検出することもできます。
写真を認識する
スキャナーはエンドユーザーのワークステーションで常に利用できるとは限りません。これは、OCRアプリケーションの目玉になる可能性があります。 OCR APIは、歪んだ、回転した、歪んだ、ノイズの多い画像を処理できる多数の前処理フィルターを提供します。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真でも確実に認識できます。前処理と画像補正のほとんどは自動的に行われますが、困難な場合はいつでも介入できます。
画像補正を適用する-Java
// OCRAPIのインスタンスを作成します
AsposeOCR api = new AsposeOCR();
// 前処理フィルターを定義する
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// 認識前に画像を前処理します
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// 画像を認識する
RecognitionResult result = api.RecognizePage(imageRes, set);
パフォーマンスの最適化
光学式文字認識には多くの処理リソースが必要であり、これはWebサービスやエントリーレベルのデバイスで問題になる可能性があります。 APIは、認識速度、リソース要件、および精度のバランスをとる非常に柔軟な方法を提供します。
- 完全な認識と高速認識のどちらかを選択します。
- 認識用に割り当てられたスレッドの数を指定するか、ライブラリがCPUコアの数に自動的にスケーリングできるようにします。
- 計算をGPUにオフロードして、CPUを解放します。
高速認識-Java
// OCRAPIのインスタンスを作成します
AsposeOCR api = new AsposeOCR();
// 最速モードで画像を認識する
String result = api.RecognizePageFast("sample.jpg");
バッチ処理
OCR APIは、1回の呼び出しで複数の画像を認識できるさまざまなバッチ処理メソッドを提供することにより、各画像を一度に1つずつ認識する必要がなくなります。
- 複数ページのPDFおよびTIFFファイルの認識。
- アーカイブ内のすべてのファイルの認識。
- フォルダ内のすべてのファイルの認識。