Java OCR APIを使用した画像からテキストへの変換
Java で画像をテキストに変換する
その他のショーケース >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Java 用 Aspose OCR ライブラリを選択する理由
Aspose OCR Java ライブラリを使用して強力な OCR をロック解除します。当社の Java API は、効率的でユーザーフレンドリーでコスト効率の高い OCR API です。ニューラル ネットワークやその他の技術的な詳細を理解する必要がなく、わずか 5 行の Java コードで強力な OCR 機能をアプリケーションに追加できます。
当社の OCR エンジンは比類のない速度と精度を提供し、英語を含む 130 以上の言語をサポートしています。 、キリル語、アラビア語、ペルシア語、中国語、日本語、韓国語、ヒンディー語、タミル語など。スキャン、スマートフォンの写真、スクリーンショット、PDF のいずれを扱う場合でも、当社の OCR はテキストを抽出し、すべての一般的な形式で結果を生成します。
画像の前処理により、回転した画像、ぼやけた画像、反転した画像、ノイズの多い画像が自動的に修正され、以下の環境で最高の認識精度が保証されます。あらゆる条件。
迅速かつ正確な OCR
当社の高度な Java テクノロジーにより、高速かつ正確な OCR 結果を実現します。
多言語サポート
英語、フランス語、キリル文字、アラビア語、ペルシア語、インド語、中国語、日本語、韓国語、タミル語、その他の文字を含む 140 以上の言語のテキストを認識します。
すべての画像
スキャナー、カメラ、スマートフォンなど、さまざまなソースからの画像を処理します。
混合言語の検出
中国語/英語、アラビア語/フランス語、ヒンディー語/英語、キリル語/英語などの混合言語で書かれた文書を認識します。
任意のフォント、スタイル、形式
テキストのレイアウトを正確に保持し、表の構造を検出し、フォント スタイルに関係なくテキストをシームレスに認識します。
ライブコードサンプル
シンプルさを体験してください: 数行の Java コードで画像をテキストに変換します
* ファイルをアップロードするかサービスを使用することにより、当社の 利用規約 そして プライバシーポリシー.
画像をテキストに変換する
さらに例を調べる >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
クロスプラットフォーム
Aspose Java OCR コードは、ローカル マシン、Web サーバー、クラウドなど、 Java SE 6.0 以降 をサポートするあらゆるプラットフォームでシームレスに動作します。 。
サポートされているファイル形式
Aspose.OCR for Java 任意の[ファイル]を操作できます( https://docs.aspose.com/ocr/java/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は保存したり、データベースにインポートしたり、リアルタイムで分析したりできます。
画像
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
バッチOCR
- Multi-page PDF
- ZIP
- Folder
認識結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
簡単な取り付け
Aspose.OCR for Java は、軽量の Java アーカイブ (JAR) ファイル、または依存関係を最小限に抑えた ダウンロード可能なファイル として配布されます。これをプロジェクトに インストール するだけで、サポートされている複数の言語でテキストを認識し、認識結果をさまざまな形式で保存する準備が整います。
試用ライセンスをリクエスト して、制限なしで完全に機能する OCR アプリケーションの開発を開始します。
どこでも使えます
当社の Java ライブラリは Java SE 6 以降を完全にサポートしており、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームでアプリケーションをシームレスに実行できます。
140 以上の認識言語
当社の Java OCR ライブラリは、世界規模での文書処理、データ抽出、コンテンツのデジタル化のためのユニバーサル ソリューションです。ヨーロッパ、中東、アジアの膨大な数の筆記体をサポートしているため、あらゆる国やビジネスにうまく適応できます。
Aspose OCR for Java は、中国語/英語、アラビア語/フランス語、キリル語/英語などの多言語ドキュメント内のテキストを認識します。次の言語がサポートされています。
- 拡張ラテン語: 英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、その他 80 以上;
- キリル文字 アルファベット: ロシア語、ウクライナ語、カザフ語、ブルガリア語 (キリル文字と英語の混合テキストを含む)。
- アラビア語、ペルシア語、ウルドゥー語、英語と混合したテキストを含む。
- 中国語、韓国語、日本語、デーヴァナーガリー語、ヒンディー語、タミル語、マラーティー語などのドラヴィダ語。
特徴と機能
Aspose.OCR for Java Aspose OCR for Java の高度な機能を調べてください。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
あらゆるスキャンを検索および編集可能なドキュメントに変換します。
URL認識
画像をローカルにダウンロードせずに、URL から画像を認識します。
一括認識
複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
任意のフォントとスタイル
すべての一般的な書体とスタイルのテキストを識別して認識します。
認識を微調整する
最良の認識結果が得られるように、すべての OCR パラメータを調整します。
スペルチェッカー
スペルミスの単語を自動的に修正することで結果を改善します。
画像内のテキストを検索する
一連の画像内のテキストまたは正規表現を検索します。
画像テキストを比較する
大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。
世界中
自動言語検出により、任意の言語のテキストを抽出します。
重要な詳細の抽出
ID カードから重要な詳細を自動的に抽出します。
Aspose ソリューションとの完全な統合
OCR を他の Aspose 製品とシームレスに統合して、包括的で効率的な Java ソリューションを実現します。
コードサンプル
コード サンプルを参照して、OCR API を Java アプリケーションにシームレスに統合する方法を学習してください。
インストール
インストール後、すぐに Aspose.OMR for Java の使用を開始できます。ただし、一定の制限があります。一時ライセンスにより、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後の段階で Aspose.OCR for Java を購入するかどうかについて十分な情報に基づいた決定を下せるようにします。
Javaでスキャン画像上のテキストを認識する
広く普及しているスキャナが不足している OCR アプリケーションの課題を克服します。当社の API は、回転、歪み、ノイズのある画像を適切に処理する強力な組み込み画像前処理フィルターを備えています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真からも確実に認識されます。ほとんどの前処理と画像補正は自動化されており、困難な場合にのみユーザーの介入が必要になります。
自動画像補正を適用する - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Java で写真からテキストを抽出する
テキストの検出と認識を Java アプリケーションに統合します。写真から正確な結果に簡単にアクセスし、画像処理能力を強化します。画像処理能力を向上させ、写真から正確な結果を取得します。
写真上のテキストを検出して認識する - Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Java でのリソースの最適化
光学式文字認識にはリソースが必要です。当社の API は、時間、価格、品質の古典的な 3 つのバランスを取る柔軟な方法を提供します。認識エンジンが使用するスレッドの数を制限できます。この調整により認識速度が遅くなる可能性がありますが、並列画像処理、Web サーバー操作、データベース管理、またはバックグラウンド データ分析などの同時タスクにリソースを割り当てることができます。
- 完全な認識と高速認識のどちらかを選択します。
- 認識用に割り当てられるスレッドの数を指定するか、ライブラリがプロセッサ コアの数に合わせて自動的にスケーリングできるようにします。
- 計算を GPU にオフロードすることで CPU を解放します。
リソースのバランスを取る
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
最小限のセットアップで高速認識
画像が歪みや歪みのない高品質スキャンの場合は、以下を使用して、最小限のリソースを消費する最速の認識モードを使用できます。
高速認識 OCR - Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});