Java 用 Aspose OCR ライブラリを選択する理由

Aspose OCR Java ライブラリを使用して強力な OCR をロック解除します。当社の Java API は、効率的でユーザーフレンドリーでコスト効率の高い OCR API です。ニューラル ネットワークやその他の技術的な詳細を理解する必要がなく、わずか 5 行の Java コードで強力な OCR 機能をアプリケーションに追加できます。

当社の OCR エンジンは比類のない速度と精度を提供し、英語を含む 130 以上の言語をサポートしています。 、キリル語、アラビア語、ペルシア語、中国語、日本語、韓国語、ヒンディー語、タミル語など。スキャン、スマートフォンの写真、スクリーンショット、PDF のいずれを扱う場合でも、当社の OCR はテキストを抽出し、すべての一般的な形式で結果を生成します。
画像の前処理により、回転した画像、ぼやけた画像、反転した画像、ノイズの多い画像が自動的に修正され、以下の環境で最高の認識精度が保証されます。あらゆる条件。

Illustration ocr

迅速かつ正確な OCR

当社の高度な Java テクノロジーにより、高速かつ正確な OCR 結果を実現します。

多言語サポート

英語、フランス語、キリル文字、アラビア語、ペルシア語、インド語、中国語、日本語、韓国語、タミル語、その他の文字を含む 140 以上の言語のテキストを認識します。

すべての画像

スキャナー、カメラ、スマートフォンなど、さまざまなソースからの画像を処理します。

混合言語の検出

中国語/英語、アラビア語/フランス語、ヒンディー語/英語、キリル語/英語などの混合言語で書かれた文書を認識します。

任意のフォント、スタイル、形式

テキストのレイアウトを正確に保持し、表の構造を検出し、フォント スタイルに関係なくテキストをシームレスに認識します。

ライブコードサンプル

シンプルさを体験してください: 数行の Java コードで画像をテキストに変換します

認識する準備ができています 認識する準備ができています ここにファイルをドロップするか、クリックして参照します *

* ファイルをアップロードするかサービスを使用することにより、当社の 利用規約 そして プライバシーポリシー.

認識結果
 

画像をテキストに変換する

さらに例を調べる >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

クロスプラットフォーム

Aspose Java OCR コードは、ローカル マシン、Web サーバー、クラウドなど、 Java SE 6.0 以降 をサポートするあらゆるプラットフォームでシームレスに動作します。 。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

サポートされているファイル形式

Aspose.OCR for Java 任意の[ファイル]を操作できます( https://docs.aspose.com/ocr/java/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は保存したり、データベースにインポートしたり、リアルタイムで分析したりできます。

画像

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

バッチOCR

  • Multi-page PDF
  • ZIP
  • Folder

認識結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

簡単な取り付け

Aspose.OCR for Java は、軽量の Java アーカイブ (JAR) ファイル、または依存関係を最小限に抑えた ダウンロード可能なファイル として配布されます。これをプロジェクトに インストール するだけで、サポートされている複数の言語でテキストを認識し、認識結果をさまざまな形式で保存する準備が整います。

試用ライセンスをリクエスト して、制限なしで完全に機能する OCR アプリケーションの開発を開始します。

どこでも使えます

当社の Java ライブラリは Java SE 6 以降を完全にサポートしており、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームでアプリケーションをシームレスに実行できます。

140 以上の認識言語

当社の Java OCR ライブラリは、世界規模での文書処理、データ抽出、コンテンツのデジタル化のためのユニバーサル ソリューションです。ヨーロッパ、中東、アジアの膨大な数の筆記体をサポートしているため、あらゆる国やビジネスにうまく適応できます。

Aspose OCR for Java は、中国語/英語、アラビア語/フランス語、キリル語/英語などの多言語ドキュメント内のテキストを認識します。次の言語がサポートされています。

  • 拡張ラテン語: 英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、その他 80 以上;
  • キリル文字 アルファベット: ロシア語、ウクライナ語、カザフ語、ブルガリア語 (キリル文字と英語の混合テキストを含む)。
  • アラビア語、ペルシア語、ウルドゥー語、英語と混合したテキストを含む。
  • 中国語、韓国語、日本語、デーヴァナーガリー語、ヒンディー語、タミル語、マラーティー語などのドラヴィダ語。

特徴と機能

Aspose.OCR for Java Aspose OCR for Java の高度な機能を調べてください。

Feature icon

写真OCR

スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。

Feature icon

検索可能なPDF

あらゆるスキャンを検索および編集可能なドキュメントに変換します。

Feature icon

URL認識

画像をローカルにダウンロードせずに、URL から画像を認識します。

Feature icon

一括認識

複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。

Feature icon

任意のフォントとスタイル

すべての一般的な書体とスタイルのテキストを識別して認識します。

Feature icon

認識を微調整する

最良の認識結果が得られるように、すべての OCR パラメータを調整します。

Feature icon

スペルチェッカー

スペルミスの単語を自動的に修正することで結果を改善します。

Feature icon

画像内のテキストを検索する

一連の画像内のテキストまたは正規表現を検索します。

Feature icon

画像テキストを比較する

大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。

Feature icon

世界中

自動言語検出により、任意の言語のテキストを抽出します。

Feature icon

重要な詳細の抽出

ID カードから重要な詳細を自動的に抽出します。

Feature icon

Aspose ソリューションとの完全な統合

OCR を他の Aspose 製品とシームレスに統合して、包括的で効率的な Java ソリューションを実現します。

コードサンプル

コード サンプルを参照して、OCR API を Java アプリケーションにシームレスに統合する方法を学習してください。

インストール

Aspose OCR for Java は、最小限の依存関係を持つ Java アーカイブ (JAR) ファイルとして、または Maven リポジトリから簡単に配布できます。好みの Java 統合開発環境 (IDE) から直接プロジェクトに統合することは、シームレスなプロセスです。インストールするだけで、あらゆる種類の OCR 機能を活用し、サポートされている形式で認識結果を保存する準備が整います。

インストール後、すぐに Aspose.OMR for Java の使用を開始できます。ただし、一定の制限があります。一時ライセンスにより、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後の段階で Aspose.OCR for Java を購入するかどうかについて十分な情報に基づいた決定を下せるようにします。

Javaでスキャン画像上のテキストを認識する

広く普及しているスキャナが不足している OCR アプリケーションの課題を克服します。当社の API は、回転、歪み、ノイズのある画像を適切に処理する強力な組み込み画像前処理フィルターを備えています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真からも確実に認識されます。ほとんどの前処理と画像補正は自動化されており、困難な場合にのみユーザーの介入が必要になります。

自動画像補正を適用する - Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

Java で写真からテキストを抽出する

テキストの検出と認識を Java アプリケーションに統合します。写真から正確な結果に簡単にアクセスし、画像処理能力を強化します。画像処理能力を向上させ、写真から正確な結果を取得します。

写真上のテキストを検出して認識する - Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java でのリソースの最適化

光学式文字認識にはリソースが必要です。当社の API は、時間、価格、品質の古典的な 3 つのバランスを取る柔軟な方法を提供します。認識エンジンが使用するスレッドの数を制限できます。この調整により認識速度が遅くなる可能性がありますが、並列画像処理、Web サーバー操作、データベース管理、またはバックグラウンド データ分析などの同時タスクにリソースを割り当てることができます。

  • 完全な認識と高速認識のどちらかを選択します。
  • 認識用に割り当てられるスレッドの数を指定するか、ライブラリがプロセッサ コアの数に合わせて自動的にスケーリングできるようにします。
  • 計算を GPU にオフロードすることで CPU を解放します。

リソースのバランスを取る

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

最小限のセットアップで高速認識

画像が歪みや歪みのない高品質スキャンの場合は、以下を使用して、最小限のリソースを消費する最速の認識モードを使用できます。

高速認識 OCR - Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});