OCR マジック: 画像をテキストに変換
画像をテキストに変換 - Java
その他のショーケース >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Java に Aspose.OCR を選択する理由
Aspose.OCR for Java のシームレスな世界を発見してください。これは、強力で使いやすく、コスト効率の高い OCR API です。複雑な数学やニューラル ネットワークを深く掘り下げることなく、5 行未満の Java コードで OCR 機能をアプリケーションに追加できます。当社の堅牢な OCR エンジンは優れた速度と精度を誇り、ラテン文字、キリル文字、中国語文字を含む 28 の言語をサポートしています。スキャンした画像やスマートフォンの写真から、スクリーンショットやスキャンした PDF まで、一般的なドキュメントやデータ交換形式で結果を取得します。回転、歪み、ノイズのある画像を処理する前処理フィルターのメリットを活用します。リソースを大量に消費するタスクを GPU にオフロードすることで、認識パフォーマンスとシステム負荷を最適化します。
迅速かつ正確な OCR
当社の高度な Java テクノロジーにより、高速かつ正確な OCR 結果を実現します。
多言語サポート
ラテン文字、キリル文字、中国語文字を含む 28 言語のテキストを認識します。
適応可能な画像のサポート
スキャナー、カメラ、スマートフォンなど、さまざまなソースからの画像を処理します。
漢字習得
6,000 を超える漢字を比類のない精度で認識します。
フォント スタイルと形式の整合性
フォント スタイルと書式設定を保持して、認識された Java テキストを忠実に表現します。
ライブコードサンプル
シンプルさを体験してください: 数行の Java コードで画像をテキストに変換します。
* ファイルをアップロードするかサービスを使用することにより、次のことに同意したことになります。 利用規約 そして プライバシーポリシー.
画像をテキストに変換する
他の例を調べる >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
どこでも Java
Aspose.OCR for Java は、ローカル マシン、Web サーバー、または雲。
サポートされているファイル形式
Aspose.OCR for Java 事実上あらゆる[ファイル]を扱うことができます( https://docs.aspose.com/ocr/java/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は、保存、データベースへのインポート、またはリアルタイムで分析できる最も一般的なファイルおよびデータ交換形式で返されます。
画像
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
バッチOCR
- Multi-page PDF
- ZIP
- Folder
認識結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
簡単な取り付け
Aspose.OCR for Java は、軽量の Java アーカイブ (JAR) ファイル、または依存関係を最小限に抑えた ダウンロード可能なファイル として配布されます。これをプロジェクトに インストール するだけで、サポートされている複数の言語でテキストを認識し、認識結果をさまざまな形式で保存する準備が整います。
試用版ライセンスをリクエスト して、制限なく完全に機能する OCR アプリケーションの開発を開始します。
Java、どこでも
当社のライブラリは Java SE 6 以降を完全にサポートしており、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームでアプリケーションをシームレスに実行できます。
28 の認識言語
当社の Java OCR API は、混合言語を含む多数の言語と一般的なスクリプトを認識します。
言語検出をライブラリに任せるか、認識パフォーマンスと信頼性を向上させるために自分で言語を定義します。
- 拡張ラテン語 アルファベット: クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語。
- キリル文字 アルファベット: ベラルーシ語、ブルガリア語、カザフ語、ロシア語、セルビア語、ウクライナ語。
- 6,000 を超える 中国語 文字。
- ヒンディー語。
機能と機能を強化する
Aspose.OCR for Java Aspose.OCR for Java の高度な機能を調べてください。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
あらゆるスキャンを完全に検索可能でインデックス可能なドキュメントに変換します。
URL認識
画像をローカルにダウンロードせずに、URL から画像を認識します。
一括認識
複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
任意のフォントとスタイル
すべての一般的な書体とスタイルのテキストを識別して認識します。
認識を微調整する
最良の認識結果が得られるように、すべての OCR パラメータを調整します。
スペルチェッカー
スペルミスの単語を自動的に修正することで結果を改善します。
画像内のテキストを検索する
一連の画像内のテキストまたは正規表現を検索します。
画像テキストを比較する
大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。
Webリンク画像認識
Web リンクから直接画像をシームレスに認識し、Java プロジェクトへの OCR 統合を強化します。
スペルミスの単語の自動修正
スペルミスの単語を自動的に修正することで OCR 結果を強化し、Java アプリケーションの精度を確保します。
Aspose エコシステムとの完全な統合
Aspose.OCR for Java を他の Aspose 製品とシームレスに統合して、包括的で効率的な Java ソリューションを実現します。
コードサンプル
コード サンプルを参照して、Aspose.OCR for Java をアプリケーションにシームレスに統合する方法を学習してください。
インストール
インストール後、すぐに Aspose.OMR for Java の使用を開始できます。ただし、一定の制限があります。一時ライセンスにより、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後の段階で Aspose.OCR for Java を購入するかどうかについて十分な情報に基づいた意思決定を行うことができます。
Javaでスキャン画像上のテキストを認識する
広く普及しているスキャナが不足している OCR アプリケーションの課題を克服します。当社の API は、回転、歪み、ノイズのある画像を適切に処理する強力な組み込み画像前処理フィルターを備えています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真からも確実に認識されます。ほとんどの前処理と画像補正は自動化されており、難しい場合にのみユーザーの介入が必要になります。
自動画像補正を適用する - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Java で写真からテキストを抽出する
テキストの検出と認識を Java アプリケーションに統合します。写真から正確な結果に簡単にアクセスし、画像処理能力を強化します。画像処理能力を向上させ、写真から正確な結果を取得します。
写真上のテキストを検出して認識する - Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Java でのリソースの最適化
光学式文字認識にはリソースが必要です。当社の API は、時間、価格、品質の古典的な 3 つのバランスをとる柔軟な方法を提供します。認識エンジンが使用するスレッドの数を制限できます。この調整により認識速度が遅くなる可能性がありますが、並列画像処理、Web サーバー操作、データベース管理、またはバックグラウンド データ分析などの同時タスクにリソースを割り当てることができます。
- 完全な認識と高速認識のどちらかを選択します。
- 認識用に割り当てられるスレッドの数を指定するか、ライブラリがプロセッサ コアの数に合わせて自動的にスケーリングできるようにします。
- 計算を GPU にオフロードすることで CPU を解放します。
リソースのバランスを取る
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
最小限のセットアップで高速認識
画像が歪みや歪みのない高品質スキャンの場合は、以下を使用して、可能な限り最小限のリソースを消費する最速の認識モードを使用できます。
高速認識 OCR - Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});