HTML JPG OCR XML BMP
Aspose.OCR  C++の場合
DOCX

[Aspose.Imaging for Java](https://products.aspose.com/imaging/java) スキャンした画像やスマートフォンの写真をGIF形式で処理し、認識されたテキストを含むGIFドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRを取得する必要があります [Maven](https://repository.aspose.com/webapp/#/artifacts/browse/tree/General/repo/com/aspose/aspose-imaging)またはAsposeMavenリポジトリ構成を指定します _pom.xml_に次の構成を追加して、Mavenベースのプロジェクトにインストールします。 Graddle、Ivy、Sbtの例については、[リポジトリ](https://repository.aspose.com/ocr/)を確認してください。

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

C ++ OCRと数行のコードを使用して、GIF画像をDOCXドキュメントに変換するフル機能のアプリケーションを作成できます。

+AsposeOcrクラスのインスタンスを作成します

  • AsposeOCR.asposeocr_page()メソッドを呼び出す +GIFファイルパスをパラメータとして渡します
  • AsposeOCR.asposeocr_pageは、DOCXタイプの文字列またはファイルを返します

システム要求

例を実行する前に、[Microsoft.ML.OnnxRuntime](https://www.nuget.org/packages/Microsoft.ML.OnnxRuntime/)1.7.0以降がプロジェクトに追加されていることを確認してください。 NuGetパッケージマネージャーを介してAspose.OCRをインストールすると、自動的にインストールされます。

-NETStandard2.0+互換ソリューション -プロジェクトで参照されているAspose.OCRfor.NET。


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • GIF とは GIF ファイル形式

    GIFまたはGraphicalInterchangeFormatは、高度に圧縮された画像の一種です。 Unisysが所有するGIFは、画質を低下させないLZW圧縮アルゴリズムを使用します。画像ごとに、GIFは通常、ピクセルあたり最大8ビットを許可し、画像全体で最大256色を許可します。最大1600万色を表示でき、人間の目の限界にかなり触れるJPEG画像とは対照的です。インターネットが登場したとき、GIFは低帯域幅を必要とし、色の単色領域を消費するグラフィックスと互換性があるため、依然として最良の選択でした。アニメーションGIFは、多数の画像またはフレームを1つのファイルに結合し、それらを順番に表示して、アニメーションクリップまたは短いビデオを生成します。色の制限は、フレームごとに最大256であり、カラーグラデーションを使用して他の画像や写真を再現するのに最も適していない可能性があります。

    続きを読む

    DOCX とは DOCX ファイル形式

    DOCXは、MicrosoftWord文書のよく知られた形式です。 2007年からMicrosoftOffice2007のリリースで導入されたこの新しいドキュメント形式の構造は、プレーンバイナリからXMLファイルとバイナリファイルの組み合わせに変更されました。 Docxファイルは、Word 2007およびラテラルバージョンで開くことができますが、DOCファイル拡張子をサポートする以前のバージョンのMSWordでは開くことができません。

    続きを読む

    TXT (テキストドキュメントファイル)
    Text (テキストドキュメントファイル)
    DOC (MicrosoftWordによって生成されたドキュメント)
    DOCX (MicrosoftWordドキュメント)
    XLS (MicrosoftExcelバイナリファイル形式)
    XLSX (MicrosoftExcelドキュメント)
    PDF (ポータブルドキュメントフォーマット(PDF))
    Searchable PDF (検索可能なポータブルネットワークグラフィックス)