HTML JPG OCR XML BMP
Aspose.OCR  .NETの場合
Searchable PDF

C#でGIFをSearchable PDFに変換します

GIFドキュメントで光学式文字認識を実行し、.NETライブラリのAspose.OCRを使用してテキストをGIFドキュメントとして保存します。

C#を使用してGIFをSearchable PDFに変換する方法

Aspose.OCR for .NETは、GIF画像をSearchable PDFドキュメントに変換するための、強力でありながら使いやすく、費用対効果の高いライブラリです。ラテン語、キリル文字、中国語に基づく26の言語をサポートする、最先端の光学式文字認識エンジンは、数式、ニューラルネットワーク、その他の複雑な技術的詳細からユーザーを隔離しながら、優れた認識速度と精度を提供します。これにより、10行未満のコードで.NETアプリケーションにOCR機能を追加できます。

[Aspose.OCR for .NET](https://products.aspose.com/ocr/net) スキャンした画像やスマートフォンの写真をGIF形式で処理し、認識されたテキストを含むGIFドキュメントを作成します。プロジェクトに追加するには、Aspose.OCRをインストールするだけです。 [NuGet](https://www.nuget.org/packages/aspose.ocr) 次のコマンドを使用してプロジェクトにパッケージ化します。

Package Manager Console Command


  PM> Install-Package Aspose.OCR

GIFをSearchable PDFに変換する手順

.NET OCRと数行のコードを使用して、GIF画像をSearchable PDFドキュメントに変換するフル機能のアプリケーションを作成できます。

+AsposeOcrクラスのインスタンスを作成します +AsposeOCR.RecognizeImageメソッドを呼び出します +GIFファイルパスをパラメータとして渡します

  • AsposeOCR.RecognizeImageは、Searchable PDFタイプの文字列またはファイルを返します

システム要求

例を実行する前に、NET Standard2.0仕様と互換性のある.NETAPIがシステムとすべての[外部依存関係](https://docs.aspose.com/ocr/net/system-requirements/#external-)にインストールされていることを確認してください。 Aspose.OCRパッケージの依存関係)がプロジェクトで参照されます。

-NETStandard2.0+互換ソリューション -プロジェクトで参照されているAspose.OCRfor.NET。

このサンプルコードは、GIFからSearchable PDF.NETへの変換を示しています


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.GIF");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
  • GIF とは GIF ファイル形式

    GIFまたはGraphicalInterchangeFormatは、高度に圧縮された画像の一種です。 Unisysが所有するGIFは、画質を低下させないLZW圧縮アルゴリズムを使用します。画像ごとに、GIFは通常、ピクセルあたり最大8ビットを許可し、画像全体で最大256色を許可します。最大1600万色を表示でき、人間の目の限界にかなり触れるJPEG画像とは対照的です。インターネットが登場したとき、GIFは低帯域幅を必要とし、色の単色領域を消費するグラフィックスと互換性があるため、依然として最良の選択でした。アニメーションGIFは、多数の画像またはフレームを1つのファイルに結合し、それらを順番に表示して、アニメーションクリップまたは短いビデオを生成します。色の制限は、フレームごとに最大256であり、カラーグラデーションを使用して他の画像や写真を再現するのに最も適していない可能性があります。

    続きを読む

    Searchable PDF とは Searchable PDF ファイル形式

    検索可能なPDFファイルは、元のスキャン画像を表示用に保持します。また、ドキュメント内の全文検索やコピーアンドペースト操作用のテキストの強調表示に使用できる非表示レイヤーのOCRテキストも保持します。 元の画像を含まない完全なOCRからPDFへの変換では、特にドキュメントに多くの画像や複雑なレイアウトがある場合、元のフォーマットが100%保持されることはありません。

    続きを読む

    その他のサポートされている変換

    C#を使用すると、を含むさまざまな形式を簡単に変換できます。

    TXT (テキストドキュメントファイル)
    Text (テキストドキュメントファイル)
    DOC (MicrosoftWordによって生成されたドキュメント)
    DOCX (MicrosoftWordドキュメント)
    XLS (MicrosoftExcelバイナリファイル形式)
    XLSX (MicrosoftExcelドキュメント)
    PDF (ポータブルドキュメントフォーマット(PDF))
    Searchable PDF (検索可能なポータブルネットワークグラフィックス)
    XML (拡張マークアップ言語)
    JSON (JavaScriptオブジェクト表記)