HTML JPG OCR XML BMP
Aspose.OCR  Javaの場合
XLS

[Aspose.Imaging for Java](https://products.aspose.com/imaging/java) スキャンした画像やスマートフォンの写真をTIFF形式で処理し、認識されたテキストを含むTIFFドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRを取得する必要があります [Maven](https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging)またはAsposeMavenリポジトリ構成を指定します _pom.xml_に次の構成を追加して、Mavenベースのプロジェクトにインストールします。 Graddle、Ivy、Sbtの例については、[リポジトリ](https://repository.aspose.com/ocr/)を確認してください。

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Java OCRと数行のコードを使用して、TIFF画像をXLSドキュメントに変換するフル機能のアプリケーションを作成できます。

+AsposeOcrクラスのインスタンスを作成します +AsposeOCR.RecognizePageメソッドを呼び出します +TIFFファイルパスをパラメータとして渡します

  • AsposeOCR.RecognizePageは、XLSタイプの文字列またはファイルを返します

システム要求

例を実行する前に、Java 2 Platform、Standard Edition(J2SE)6.0(1.6)以降がシステムにインストールされていることを確認してください。

-JDK1.6以降がインストールされています。


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • TIFF とは TIFF ファイル形式

    TIFFまたはTIF(タグ付き画像ファイル形式)は、このファイル形式標準に準拠するさまざまなデバイスでの使用を目的としたラスター画像を表します。いくつかの色空間で、バイレベル、グレースケール、パレットカラー、およびフルカラーの画像データを記述することができます。この形式を使用するアプリケーションのスペースと時間のどちらかを選択するための非可逆圧縮方式と可逆圧縮方式をサポートしています。このフォーマットは拡張可能であり、無制限の量の個人情報または特別目的情報を含めることができるようにいくつかの改訂が行われています。この形式はマシンに依存せず、プロセッサ、オペレーティングシステム、ファイルシステムなどの境界がありません。

    続きを読む

    XLS とは XLS ファイル形式

    XLS拡張子の付いたファイルは、Excelバイナリファイル形式を表します。このようなファイルは、Microsoft Excelだけでなく、OpenOfficeCalcやAppleNumbersなどの他の同様のスプレッドシートプログラムでも作成できます。 Excelによって保存されたファイルは、ワークブックと呼ばれ、各ワークブックに1つ以上のワークシートを含めることができます。データはワークシートに表形式で保存および表示され、数値、テキストデータ、数式、外部データ接続、画像、およびグラフにまたがることができます。 Microsoft Excelなどのアプリケーションを使用すると、ワークブックデータをPDF、CSV、XLSX、TXT、HTML、XPSなどのさまざまな形式にエクスポートできます。 XLSファイル形式は、Microsoft Excel 2007のリリースにより、よりオープンで構造化された形式であるXLSXに置き換えられました。現在、XLSXが最初に使用されていますが、最新バージョンではXLSファイルの作成と読み取りが引き続きサポートされています。

    続きを読む

    TXT (テキストドキュメントファイル)
    Text (テキストドキュメントファイル)
    DOC (MicrosoftWordによって生成されたドキュメント)
    DOCX (MicrosoftWordドキュメント)
    XLS (MicrosoftExcelバイナリファイル形式)
    XLSX (MicrosoftExcelドキュメント)
    PDF (ポータブルドキュメントフォーマット(PDF))
    Searchable PDF (検索可能なポータブルネットワークグラフィックス)
    XML (拡張マークアップ言語)
    JSON (JavaScriptオブジェクト表記)