HTML JPG OCR XML BMP
Aspose.OCR  Javaの場合
XML

[Aspose.Imaging for Java](https://products.aspose.com/imaging/java) スキャンした画像やスマートフォンの写真をGIF形式で処理し、認識されたテキストを含むGIFドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRを取得する必要があります [Maven](https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging)またはAsposeMavenリポジトリ構成を指定します _pom.xml_に次の構成を追加して、Mavenベースのプロジェクトにインストールします。 Graddle、Ivy、Sbtの例については、[リポジトリ](https://repository.aspose.com/ocr/)を確認してください。

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCRと数行のコードを使用して、GIF画像をXMLドキュメントに変換するフル機能のアプリケーションを作成できます。

+AsposeOcrクラスのインスタンスを作成します +AsposeOCR.RecognizePageメソッドを呼び出します +GIFファイルパスをパラメータとして渡します

  • AsposeOCR.RecognizePageは、XMLタイプの文字列またはファイルを返します

システム要求

例を実行する前に、Java 2 Platform、Standard Edition(J2SE)6.0(1.6)以降がシステムにインストールされていることを確認してください。

-JDK1.6以降がインストールされています。


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • GIF とは GIF ファイル形式

    GIFまたはGraphicalInterchangeFormatは、高度に圧縮された画像の一種です。 Unisysが所有するGIFは、画質を低下させないLZW圧縮アルゴリズムを使用します。画像ごとに、GIFは通常、ピクセルあたり最大8ビットを許可し、画像全体で最大256色を許可します。最大1600万色を表示でき、人間の目の限界にかなり触れるJPEG画像とは対照的です。インターネットが登場したとき、GIFは低帯域幅を必要とし、色の単色領域を消費するグラフィックスと互換性があるため、依然として最良の選択でした。アニメーションGIFは、多数の画像またはフレームを1つのファイルに結合し、それらを順番に表示して、アニメーションクリップまたは短いビデオを生成します。色の制限は、フレームごとに最大256であり、カラーグラデーションを使用して他の画像や写真を再現するのに最も適していない可能性があります。

    続きを読む

    XML とは XML ファイル形式

    XMLはExtensibleMarkupLanguageの略で、HTMLに似ていますが、オブジェクトを定義するためのタグの使用が異なります。 XMLファイル形式の作成の背後にある全体的な考え方は、ソフトウェアやハードウェアのツールに依存することなくデータを保存および転送することでした。その人気は、人間と機械の両方で読み取り可能であるためです。これにより、World Wide Web(WWW)などのネットワークを介して保存および共有されるオブジェクトの形式で共通のデータプロトコルを作成できます。 XMLの「X」は拡張可能であり、ユーザーの要件に応じて言語を任意の数の記号に拡張できることを意味します。 Microsoft Open XML、LibreOffice OpenDocument、XHTML、SVGなど、多くの標準ファイル形式で使用されるのはこれらの機能のためです。

    続きを読む

    TXT (テキストドキュメントファイル)
    Text (テキストドキュメントファイル)
    DOC (MicrosoftWordによって生成されたドキュメント)
    DOCX (MicrosoftWordドキュメント)
    XLS (MicrosoftExcelバイナリファイル形式)
    XLSX (MicrosoftExcelドキュメント)
    PDF (ポータブルドキュメントフォーマット(PDF))
    Searchable PDF (検索可能なポータブルネットワークグラフィックス)
    XML (拡張マークアップ言語)
    JSON (JavaScriptオブジェクト表記)