[Aspose.Imaging for Java](https://products.aspose.com/imaging/java) スキャンした画像やスマートフォンの写真をDJVU形式で処理し、認識されたテキストを含むDJVUドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRを取得する必要があります [Maven](https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging)またはAsposeMavenリポジトリ構成を指定します _pom.xml_に次の構成を追加して、Mavenベースのプロジェクトにインストールします。 Graddle、Ivy、Sbtの例については、[リポジトリ](https://repository.aspose.com/ocr/)を確認してください。
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Java OCRと数行のコードを使用して、DJVU画像をXMLドキュメントに変換するフル機能のアプリケーションを作成できます。
+AsposeOcrクラスのインスタンスを作成します +AsposeOCR.RecognizePageメソッドを呼び出します +DJVUファイルパスをパラメータとして渡します
- AsposeOCR.RecognizePageは、XMLタイプの文字列またはファイルを返します
システム要求
例を実行する前に、Java 2 Platform、Standard Edition(J2SE)6.0(1.6)以降がシステムにインストールされていることを確認してください。
-JDK1.6以降がインストールされています。
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
DJVU とは DJVU ファイル形式
「déjàvu」と発音されるDjVuは、スキャンされたドキュメントや書籍、特にテキスト、図面、画像、写真の組み合わせを含むものを対象としたグラフィックファイル形式です。 AT&T研究所によって開発されました。テキストと背景画像の画像レイヤー分離、プログレッシブローディング、算術符号化、ビットノン画像の不可逆圧縮などの複数の手法を使用します。 DJVUファイルには、圧縮された高品質のカラー画像、写真、テキスト、および図面を含めることができ、より少ないスペースで保存できるため、電子書籍、マニュアル、新聞、古代文書などとしてWebで使用されます。
続きを読むXML とは XML ファイル形式
XMLはExtensibleMarkupLanguageの略で、HTMLに似ていますが、オブジェクトを定義するためのタグの使用が異なります。 XMLファイル形式の作成の背後にある全体的な考え方は、ソフトウェアやハードウェアのツールに依存することなくデータを保存および転送することでした。その人気は、人間と機械の両方で読み取り可能であるためです。これにより、World Wide Web(WWW)などのネットワークを介して保存および共有されるオブジェクトの形式で共通のデータプロトコルを作成できます。 XMLの「X」は拡張可能であり、ユーザーの要件に応じて言語を任意の数の記号に拡張できることを意味します。 Microsoft Open XML、LibreOffice OpenDocument、XHTML、SVGなど、多くの標準ファイル形式で使用されるのはこれらの機能のためです。
続きを読む