Javaで画像とPDFをテキストに変換する

光学式文字認識（OCR）機能を備えたクロスプラットフォームのJavaアプリケーションを簡単に作成できます。

Aspose.OCR for Javaを使用すると、画像、スクリーンショット、画像の特定の領域からテキストを抽出し、Javaをサポートする任意のプラットフォームでスキャンしたファイルから検索可能なPDFを作成できます。強力でありながら使いやすいAPIを備えているため、複雑なOCRタスクでも10行未満のコードで済みます。数式や機械学習を操作する必要はありません。ライブラリがすべての技術的な詳細を処理し、ラテン文字とキリル文字、および中国語に基づいて26の言語で信頼できる結果を生成します。 OCR APIは、スキャンされた画像、スマートフォンの写真、スクリーンショット、画像の領域、スキャンされたPDFを処理し、最も一般的なドキュメント形式で結果を返します。複数のCPUコアに計算を分散し、リソースを大量に消費するタスクをGPUにオフロードすることで、認識速度、精度、パフォーマンスをさらに向上させることができます。

一目で

光学式文字認識機能の概要。

サポートされているフォント

Arial
Times New Roman
Courier New
Tahoma
Calibri
Verdana

認識

画像全体
画像領域
アーカイブとフォルダ

サポートされている言語

英語
中国語
ドイツ語
フランス語
スロベニア語
スペイン語
チェコ語
ポーランド語
ルーマニア語
オランダ語
ロシア語
および10以上

Aspose.OCR

プラットフォームの独立性

Aspose.OCR for Javaは、JDK1.6以降をサポートします。

プラグイン

Ruby
PHP
IntelliJ IDEA - Maven

Java Runtime Environment

JSP/JSFアプリケーション
デスクトップアプリケーション

Aspose.OCR

サポートされているファイル形式

スキャナーまたはカメラから取得したファイルを、最も一般的なドキュメントおよびデータ交換形式に変換します。

ソースファイル

PDF
JPEG
PNG
TIFF
GIF
BMP

認識結果

検索可能なPDF
Microsoft Word
Microsoft Excel
プレーンテキスト
JSON
XML

Aspose.OCR

Aspose.OCRforJavaの機能と機能

スキャンした画像やPDFでフォーマットされたテキストを認識します

スキャナーまたはカメラから取得できるすべてのファイル形式をサポートします

ラテン文字とキリル文字を読みます

6,000以上の漢字を認識します

人気のあるすべての書体を検出して認識します

フォントスタイルとフォーマットを注意深く保持します

画像全体または選択した領域のみを処理します

回転した画像、歪んだ画像、ノイズの多い画像をサポート

フォルダまたはアーカイブ内のすべての画像のバッチ認識

Webリンクとして提供された画像を認識します

スペルミスのある単語を検索して自動的に修正します

他のAspose製品との100％の互換性

インストールが簡単

簡単なインストール手順に従って、 Mavenベースのプロジェクトから直接Aspose.OCRforJavaを使用できます。

制限や制限なしに完全に機能するOCRアプリケーションの構築を開始するには、一時ライセンスを要求してください。

$Easy to Use$

画像認識には数行のコードが必要です。文字通り。それは本当にとても簡単です-自分で試してみてください：

7行の画像からテキストへ-Java

// OCRAPIのインスタンスを作成します
AsposeOCR api = new AsposeOCR();

try {
    // 画像を認識する
    String result = api.RecognizePage(imagePath);
    // 認識結果を表示する
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // エラー処理
    e.printStackTrace();
}

26認識言語

OCR APIは、多数の言語と、混合言語のテキストを含むすべての一般的な書き込みスクリプトをサポートしています。組み込みのスペルチェッカーは、スペルミスのある単語を自動的に置き換え、認識結果を手動で修正する手間を省きます。

拡張ラテンアルファベット：クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エストニア語、フィンランド語、フランス語、ドイツ語、イタリア語、ラトビア語、リトアニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スペイン語、スウェーデン語。
キリル文字：ベラルーシ語、ブルガリア語、カザフスタン語、ロシア語、セルビア語、ウクライナ語。
中国語：6,000文字以上。

言語を指定して認識のパフォーマンスと信頼性を向上させたり、APIに言語を自動的に検出させたりすることができます。

フォーマットを保持する

OCR APIは、Arial、Times New Roman、Courier New、Tahoma、Calibriなどの一般的なすべての書体を通常の太字および斜体のスタイルで読み取り、OCR結果の書式を慎重に保持します。認識結果を行に分割し、ページ内のテキスト領域を検出することもできます。

写真を認識する

スキャナーはエンドユーザーのワークステーションで常に利用できるとは限りません。これは、OCRアプリケーションの目玉になる可能性があります。 OCR APIは、歪んだ、回転した、歪んだ、ノイズの多い画像を処理できる多数の前処理フィルターを提供します。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真でも確実に認識できます。前処理と画像補正のほとんどは自動的に行われますが、困難な場合はいつでも介入できます。

画像補正を適用する-Java

// OCRAPIのインスタンスを作成します
AsposeOCR api = new AsposeOCR();

// 前処理フィルターを定義する
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// 認識前に画像を前処理します
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// 画像を認識する
RecognitionResult result = api.RecognizePage(imageRes, set);

パフォーマンスの最適化

光学式文字認識には多くの処理リソースが必要であり、これはWebサービスやエントリーレベルのデバイスで問題になる可能性があります。 APIは、認識速度、リソース要件、および精度のバランスをとる非常に柔軟な方法を提供します。

完全な認識と高速認識のどちらかを選択します。
認識用に割り当てられたスレッドの数を指定するか、ライブラリがCPUコアの数に自動的にスケーリングできるようにします。
計算をGPUにオフロードして、CPUを解放します。

高速認識-Java

// OCRAPIのインスタンスを作成します
AsposeOCR api = new AsposeOCR();

// 最速モードで画像を認識する
String result = api.RecognizePageFast("sample.jpg");

バッチ処理

OCR APIは、1回の呼び出しで複数の画像を認識できるさまざまなバッチ処理メソッドを提供することにより、各画像を一度に1つずつ認識する必要がなくなります。

複数ページのPDFおよびTIFFファイルの認識。
アーカイブ内のすべてのファイルの認識。
フォルダ内のすべてのファイルの認識。

Support and Learning Resources

Aspose.OCR forJavaを選ぶ理由
顧客リスト
サクセスストーリー

Download Free Trial Pricing Information

Asposeは、他の一般的なプログラミング言語用のネイティブOCRAPIも提供しています。

Javaで画像とPDFをテキストに変換する

光学式文字認識（OCR）機能を備えたクロスプラットフォームのJavaアプリケーションを簡単に作成できます。

Aspose.OCR for Java

Overview

一目で

プラットフォームの独立性

サポートされているファイル形式

Aspose.OCRforJavaの機能と機能

インストールが簡単

$Easy to Use$

7行の画像からテキストへ-Java

26認識言語

フォーマットを保持する

写真を認識する

画像補正を適用する-Java

パフォーマンスの最適化

高速認識-Java

バッチ処理

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forC++