HTML JPG OCR XML BMP
Aspose.OCR  Javaの場合
DOC

[Aspose.Imaging for Java](https://products.aspose.com/imaging/java) スキャンした画像やスマートフォンの写真をJPEG2000形式で処理し、認識されたテキストを含むJPEG2000ドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRを取得する必要があります [Maven](https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging)またはAsposeMavenリポジトリ構成を指定します _pom.xml_に次の構成を追加して、Mavenベースのプロジェクトにインストールします。 Graddle、Ivy、Sbtの例については、[リポジトリ](https://repository.aspose.com/ocr/)を確認してください。

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCRと数行のコードを使用して、JPEG2000画像をDOCドキュメントに変換するフル機能のアプリケーションを作成できます。

+AsposeOcrクラスのインスタンスを作成します +AsposeOCR.RecognizePageメソッドを呼び出します +JPEG2000ファイルパスをパラメータとして渡します

  • AsposeOCR.RecognizePageは、DOCタイプの文字列またはファイルを返します

システム要求

例を実行する前に、Java 2 Platform、Standard Edition(J2SE)6.0(1.6)以降がシステムにインストールされていることを確認してください。

-JDK1.6以降がインストールされています。


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPEG2000 とは JPEG2000 ファイル形式

    JPEG 2000(JP2)は、画像コーディングシステムであり、最先端の画像圧縮規格です。ウェーブレットテクノロジーを使用して設計されたJPEG2000は、ロスレスコンテンツを任意の品質で一度にコーディングできます。さらに、コーディング効率に実質的なペナルティを課すことなく、JPEG 2000には、同じコンテンツに効果的にアクセスしてデコードし、他のさまざまな解像度や品質に変換する機能があります。 JPEG 2000のコードストリームは非常にスケーラブルであり、空間ランダムアクセスの機能を提供する関心領域があります。テラピクセル単位の寸法と38ビット/サンプルの高精度を備えた最大16384の多様なコンポーネントを備えています。

    続きを読む

    DOC とは DOC ファイル形式

    拡張子が.docのファイルは、MicrosoftWordまたはその他のワードプロセッシングドキュメントによって生成されたドキュメントをバイナリファイル形式で表します。この拡張機能は、当初、いくつかの異なるオペレーティングシステムでプレーンテキストのドキュメントに使用されていました。画像、プレーンテキスト、グラフ、チャート、埋め込みオブジェクト、リンク、ページ、ページの書式設定、印刷設定など、さまざまな種類のデータを含めることができます。このフォーマットは、マニュアル、提案、仕様、履歴書、記事、または同様のドキュメントを作成するためのさまざまなオプションがユーザーに提供されるため、あらゆる種類のドキュメントで人気がありました。 DOCの更新バージョンはDOCXであり、仕様が公開されているOfficeOpenXMLに基づいています。

    続きを読む

    TXT (テキストドキュメントファイル)
    Text (テキストドキュメントファイル)
    DOC (MicrosoftWordによって生成されたドキュメント)
    DOCX (MicrosoftWordドキュメント)
    XLS (MicrosoftExcelバイナリファイル形式)
    XLSX (MicrosoftExcelドキュメント)
    PDF (ポータブルドキュメントフォーマット(PDF))
    Searchable PDF (検索可能なポータブルネットワークグラフィックス)
    XML (拡張マークアップ言語)
    JSON (JavaScriptオブジェクト表記)