[Aspose.Imaging for Java](https://products.aspose.com/imaging/java) スキャンした画像やスマートフォンの写真をPDF形式で処理し、認識されたテキストを含むPDFドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRを取得する必要があります [Maven](https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging)またはAsposeMavenリポジトリ構成を指定します _pom.xml_に次の構成を追加して、Mavenベースのプロジェクトにインストールします。 Graddle、Ivy、Sbtの例については、[リポジトリ](https://repository.aspose.com/ocr/)を確認してください。
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
C ++ OCRと数行のコードを使用して、PDF画像をTXTドキュメントに変換するフル機能のアプリケーションを作成できます。
+AsposeOcrクラスのインスタンスを作成します
- AsposeOCR.asposeocr_page()メソッドを呼び出す +PDFファイルパスをパラメータとして渡します
- AsposeOCR.asposeocr_pageは、TXTタイプの文字列またはファイルを返します
システム要求
例を実行する前に、[Microsoft.ML.OnnxRuntime](https://www.nuget.org/packages/Microsoft.ML.OnnxRuntime/)1.7.0以降がプロジェクトに追加されていることを確認してください。 NuGetパッケージマネージャーを介してAspose.OCRをインストールすると、自動的にインストールされます。
-NETStandard2.0+互換ソリューション -プロジェクトで参照されているAspose.OCRfor.NET。
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
PDF とは PDF ファイル形式
Portable Document Format(PDF)は、1990年代にAdobeによって作成されたドキュメントの一種です。このファイル形式の目的は、アプリケーションソフトウェア、ハードウェア、およびオペレーティングシステムに依存しない形式で、ドキュメントやその他の参照資料を表現するための標準を導入することでした。 PDFファイル形式には、テキスト、画像、ハイパーリンク、フォームフィールド、リッチメディア、デジタル署名、添付ファイル、メタデータ、地理空間機能、ソースドキュメントの一部として使用できる3Dオブジェクトなどの情報を含めることができます。
続きを読むTXT とは TXT ファイル形式
拡張子が.TXTのファイルは、行形式のプレーンテキストを含むテキストドキュメントを表します。テキストドキュメントの段落は、キャリッジリターンによって認識され、ファイルの内容をより適切に配置するために使用されます。標準のテキストドキュメントは、さまざまなオペレーティングシステムの任意のテキストエディタまたはワードプロセッシングアプリケーションで開くことができます。このようなファイルに含まれるすべてのテキストは、人間が読める形式であり、一連の文字で表されます。
続きを読む