Java OCR APIを使用した画像からテキスト
Javaのテキストに画像を変換します
その他のショーケース >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
なぜJavaにAspose OCRライブラリを選ぶのですか?
Aspose OCR Javaライブラリを使用して強力なOCRのロックを解除します。 Java APIは、効率的でユーザーフレンドリーで、費用対効果の高いOCR APIです。 Javaコードのわずか5行で、ニューラルネットワークやその他の技術的詳細を理解する必要なく、アプリケーションに強力なOCR機能を追加します。スキャン、スマートフォンの写真、スクリーンショット、またはPDFを使用するかどうかにかかわらず、OCRはテキストを抽出し、すべての一般的な形式で結果を生成します。

迅速かつ正確なOCR
高度なJavaテクノロジーで高速で正確なOCRの結果を達成します。
多言語サポート
英語、フランス語、キリル語、アラビア語、ペルシャ語、インド語、中国語、日本語、韓国語、タミル語、その他のスクリプトを含む140以上の言語でテキストを認識します。
すべての画像
スキャナー、カメラ、スマートフォンなど、さまざまなソースから画像を処理します。
混合言語検出
中国語/英語、アラビア語/フランス語、ヒンディー語/英語、キリル語/英語などの混合言語で書かれた文書を認識します。
フォント、スタイル、フォーマット
テキストレイアウトを正確に保存し、テーブル構造を検出し、フォントスタイルに関係なくテキストをシームレスに認識します。
ライブコードサンプル
シンプルさを体験する:Javaコードの数行で画像をテキストに変換する
*ファイルをアップロードするか、サービスを使用することにより、私たちに同意することにより 利用規約 そして プライバシーポリシー.
画像をテキストに変換します
より多くの例を調べてください >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
クロスプラットフォーム
Aspose Java OCRコードは、[Java SE 6.0以上](https://docsops.com/ocr/java/system-requirements/)をサポートする任意のプラットフォームでシームレスに動作します。ローカルマシン、Webサーバー、またはクラウド。
サポートされているファイル形式
Aspose.OCR for Java [ファイル]で動作することができます( https://docs.aspose.com/ocr/java/supported-file-formats/ ) スキャナーやカメラから入手できます。認識結果は、保存したり、データベースにインポートしたり、リアルタイムで分析されたりできます。
画像
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
バッチOCR
- Multi-page PDF
- ZIP
- Folder
認識結果
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
簡単なインストール
Java用のAsophe.ocrは、軽量のJavaアーカイブ(JAR)ファイルとして、または[ダウンロード可能なファイル](https://releases.aspose.com/ocr/java/)として配布されます。単純に[install](https://docs.aspose.com/ocr/java/installation/)プロジェクトに参加すると、複数のサポート言語でテキストを認識し、さまざまな形式で認識結果を保存するように設定されています。
[トライアルライセンスを要求](https://purchase.aspose.com/temporary-license)完全に機能的なOCRアプリケーションの開発を制限せずに開始します。
どこでも機能します
Java LibraryはJava SE 6以降を完全にサポートしているため、デスクトップWindows、Windows Server、MacOS、Linux、The Cloudなど、あらゆるプラットフォームでアプリケーションをシームレスに実行できます。
140以上の認識言語
Java OCRライブラリは、グローバルスケールでのドキュメント処理、データ抽出、コンテンツデジタル化のための普遍的なソリューションです。ヨーロッパ、中東、アジアの執筆スクリプトの膨大な数々を支援しているため、あらゆる国やビジネスに適しています。
JavaのAspose OCRは、中国語/英語、アラビア語/フランス語、キリル/英語などの多言語文書でテキストを認識しています。次の言語がサポートされています。
- 拡張ラテン語:英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、および80歳以上。
- キリル語アルファベット:ロシア語、ウクライナ人、カザフ、ブルガリア語、混合キリル語/英語のテキストを含む。
- アラビア語、ペルシャ語、ウルドゥー語、英語と混ざったテキストを含む。
- ヒンディー語、タミル語、マラーティー語などを含む中国語、韓国語、日本語、デヴァナガリ、ドラヴィダ語。
機能と機能
Aspose.OCR for Java Java用のAspose OCRの高度な機能と機能を調べてください。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
スキャンを検索可能で編集可能なドキュメントに変換します。
URL認識
ローカルにダウンロードせずにURLから画像を認識します。
バルク認識
マルチページドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
フォントとスタイル
すべての人気のある書体とスタイルでテキストを特定して認識します。
微調整の認識
最良の認識結果については、すべてのOCRパラメーターを調整します。
スペルチェッカー
間違いのある単語を自動的に修正することにより、結果を改善します。
画像でテキストを見つけます
一連の画像内でテキストまたは正規表現を検索します。
画像テキストを比較します
ケースとレイアウトに関係なく、2つの画像のテキストを比較します。
世界中
自動言語検出で任意の言語のテキストを抽出します。
重要な詳細抽出
IDカードから重要な詳細を自動的に抽出します。
Aspose Solutionsとの完全な統合
OCRを他のAspose製品とシームレスに統合して、包括的で効率的なJavaソリューションを使用します。
コードサンプル
コードサンプルを調べて、OCR APIをJavaアプリケーションにシームレスに統合する方法を学習します。
インストール
Javaのスキャンされた画像のテキストを認識します
広範囲にわたるスキャナーを欠くOCRアプリケーションの課題を克服します。私たちのAPIは、回転、歪んだ、ノイズの多い画像をアプアーに処理する強力な内蔵画像前処理フィルターを誇っています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真からでも信頼できる認識が保証されます。ほとんどの前処理と画像補正は自動化されており、困難な場合にのみ介入が必要です。
自動画像補正を適用-Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Javaの写真からテキストを抽出します
Javaアプリケーションにテキストの検出と認識を統合します。写真からの正確な結果に簡単にアクセスし、画像処理機能が向上します。画像処理機能を高め、写真から正確な結果を得ます。
写真でテキストを検出して認識します-Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Javaのリソース最適化
光学文字認識にはリソースが必要です。私たちのAPIは、古典的なタイム価格の品質のトライアドのバランスをとる柔軟な方法を提供します。これにより、認識エンジンが使用するスレッドの数を制限できます。この調整により、認識速度が遅くなる可能性がありますが、並列画像処理、Webサーバー操作、データベース管理、バックグラウンドデータ分析などの同時タスクにリソースを割り当てることができます。
- 徹底的な認識と迅速な認識から選択します。
- 認識のために割り当てられたスレッドの数を指定するか、ライブラリがプロセッサコアの数に自動的にスケーリングできるようにします。
- GPUに計算をオフロードすることにより、CPUを解放します。
リソースのバランスをとるuasage
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
最小限のセットアップでの高速認識
画像がスキューや歪みのない高品質のスキャンである場合、以下を使用して最小限のリソースを消費する最速の認識モードを使用できます。
高速認識OCR -Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});