Aspose OCRライブラリを選択する理由

数秒で.NETアプリに強力なOCR機能を構築します。使いやすいOCR APIを使用すると、画像やスキャンからテキストを抽出したり、検索可能なPDFを作成したり、C#コードを最小限に抑えたりできます。 .NETデスクトップ、Web、クラウド、サーバーレス機能に最適です。
テキストを抽出するだけでなく、AIで理解して強化するOCRを体験してください。以下のアイテムをクリックして、機能と利点の詳細をご覧ください。

Illustration ocr

グローバルOCRアプリケーション

C#OCRは、英語、キリル語、アラビア語、ペルシャ語、中国語、日本、韓国語、ヒンディー語、タミル語、および混合言語のテキストを認識しています。

すべてを読んでください

スキャナーまたはカメラから取得したファイルからテキストを取得し、Webリンクから直接画像を処理します。

信頼できる結果

焦点が合っていない、回転、歪んだ、ノイズの多い画像を含むすべての画像の高い認識精度を実現します。

バッチ認識

フォルダーやアーカイブからのすべての画像をかなり認識します。マルチページPDFドキュメントとTIFF画像を読んでください。

レイアウト検出

画像内のコンテンツブロックを識別して分類して、レイアウトに関係なく、抽出されたテキストの正しい順序を確保します。

LLMSを使用したAI後処理

Not just OCR — your all-in-one AI solution for smarter, error-free text recognition. Aspose.ocrは、AIとLLMSを統合して、OCRの精度を大幅に向上させるモデルを選択します。エラーの固定、欠落テキストの復元、全体的な認識品質の向上。

ライブコードサンプル

.NET OCRは、新しい開発者であっても、Aspose OCR APIを使用した些細で簡単なタスクになります。画像からテキストを抽出して画面に表示するのに十分なコードで十分です。本当に簡単です - 試してみてください。

認識する準備ができました 認識する準備ができました ここにファイルをドロップするか、クリックして閲覧 *

*ファイルをアップロードするか、サービスを使用することにより、私たちに同意することにより 利用規約 そして プライバシーポリシー.

認識結果
 

画像をテキストに変換します

その他の例 >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

プラットフォームの独立性

クロスプラットフォームOCRライブラリは、[どこでも](どこでも)(https://docs.asops.com/ocr/net/system-requirements/).net、.net coreまたは.netフレームワーク - ローカルマシン、Webサーバー、またはクラウドのいずれか。

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

サポートされているファイル形式

Aspose.OCR for .NET [ファイル]で動作することができます( https://docs.aspose.com/ocr/net/supported-file-formats/ ) スキャナーやカメラから入手できます。認識結果は、保存したり、データベースにインポートしたり、リアルタイムで分析されたりできます。

画像

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

バッチOCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

認識結果

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

LLM駆動のOCR:AI言語モデルによって駆動される次世代のOCR。

結果の精度は認識時に停止しません。外部LLMを使用してテキストを改良することにより、次のレベルの品質のロックを解除します。

  • 認識されたテキストでスペルと文法を自動的に修正します。
  • マルチページスキャン全体の不一致とフォーマットの問題を正常化します。
  • 迅速な駆動型モデルを使用して、被験者固有の語彙に認識結果を適応させます。
  • 数行のコードを使用して、外部LLMパイプラインをOCRワークフローに統合します。

コンテンツに適しています

C#におけるテキスト認識の正確性と信頼性は、大部分が画質に依存します。 .NET OCRは、自動化された手動の画像最適化の完全なセットを提供し、優れた認識結果を確保します。

強力な画像処理、完全にカスタマイズ可能なテキスト検出、後処理、および自動化されたスペルの修正により、スキャンや写真からのテキスト抽出が最も精度の高いテキスト抽出を可能にします。

OCRリソースの最適化

Aspose ‘C#OCRライブラリは、特定のユースケースごとに認識速度、品質、およびリソースの使用率を非常に柔軟にバランスさせることができます。

  • 徹底的な認識と迅速な認識から選択します。
  • 認識のために割り当てられたスレッドの数を指定するか、.NET OCRライブラリがプロセッサコアの数に自動的にスケーリングできるようにします。
  • 計算をGPUにオフロードすることにより、CPUを解放します。

140以上の認識言語

C#OCRライブラリは、グローバルスケールでのドキュメント処理、データ抽出、コンテンツデジタル化のための普遍的なソリューションです。ヨーロッパ、中東、アジアの執筆スクリプトの膨大な数々を支援しているため、あらゆる国やビジネスに適しています。

中国語/英語、アラビア語/フランス語、キリル/英語などの混合言語で書かれた文書を認識できます。次の言語がサポートされています。

  • 拡張ラテン語:英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、および80歳以上。
  • キリル語アルファベット:ロシア語、ウクライナ人、カザフ、ブルガリア語、混合キリル語/英語のテキストを含む。
  • アラビア語、ペルシャ語、ウルドゥー語、英語と混ざったテキストを含む。
  • ヒンディー語、タミル語、マラーティー語などを含む中国語、韓国語、日本語、デヴァナガリ、ドラヴィダ語。

機能と機能

C#OCRは、写真やスキャンからテキストを自動的に抽出し、ドキュメントの手動リトリピングの必要性を排除します。

Feature icon

写真OCR

スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。

Feature icon

検索可能なPDF

スキャンを完全に検索可能でインデックス可能なドキュメントに変換します。

Feature icon

URL認識

ローカルにダウンロードせずにURLから画像を認識します。

Feature icon

バルク認識

マルチページドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。

Feature icon

フォントとスタイル

すべての人気のある書体とスタイルでテキストを特定して認識します。

Feature icon

微調整の認識

最良の認識結果については、すべてのOCRパラメーターを調整します。

Feature icon

スペルチェッカー

間違いのある単語を自動的に修正することにより、結果を改善します。

Feature icon

画像でテキストを見つけます

一連の画像内でテキストまたは正規表現を検索します。

Feature icon

画像テキストを比較します

ケースとレイアウトに関係なく、2つの画像のテキストを比較します。

Feature icon

AI搭載補正

トランスベースのLLMSを使用して、誤った認識の単語と文法を修正します - カスタムトレーニングは必要ありません。

Feature icon

セマンティックポストプロセス

キャラクターを超えて:騒々しいOCR出力をLLMSで洗練して、コンテンツの品質と言語の正規化を改善します。

Feature icon

プラグインLLMパイプライン

外部言語モデルを接続して、OCR認識のミスを修正し、不完全または断片化されたテキストを復元します。

使いやすいOCR

C#OCR APIを使用すると、画像をテキストに変換し、検索可能なPDFを作成し、認識結果を保存して文書化するなど、C#コードの数行しか必要ありません。コードサンプルを調べて、OCR APIを.NETソリューションに統合する方法を理解します。

インストール

.NET OCRは、[nugetパッケージ](https://www.nuget.org/packages/aspose.ocr/)または[ダウンロード可能なファイル](https://releases.aspose.com/ocr/net/)として最小依存関係を備えています。パッケージは、Microsoft Visual Studioから直接プロジェクトに追加できます。プロジェクトにインストールするだけで、画像からテキストを抽出し、サポートされている形式のいずれかで認識結果を保存する準備ができています。システムにCUDA対応のGPUがある場合は、[GPU-アクセラレーションOCRエンジン](https://docsops.com/ocr/net/installation/gpu/)を使用して、認識パフォーマンスを大幅に向上させることができます。

インストールの直後に、[制限](https://docsops.com/ocr/net/licensing/)を使用して、.netにaspose ocrの使用を開始できます。一時的なライセンスにより、30日間の試用版のすべての制限が削除されます。それを使用して、完全に機能するOCRアプリケーションの構築を開始し、後で.NET用にOCRを購入するという最終決定を行います。

写真からテキストを抽出します

人々が通常OCR(光学文字認識)を考える場合、最初の関連性は多くの場合、プライマリキャプチャデバイスとしてスキャナーを使用します。この協会には歴史的な理由があり、多くのコンテキストで依然として一般的であり、比類のない品質の物理文書から印刷されたテキストをキャプチャするための一貫した制御された環境を提供します。ただし、スキャナーは、常に手元にあるとは限らず、動作するために固定ワークステーションが必要な特殊な機器です。幸いなことに、現代世界は、従来のスキャナー(スマートフォンカメラ)に便利な代替品を提供します。スマートフォンカメラテクノロジーの進歩により、エントリーレベルのスマートフォンでさえ、OCR対応のドキュメントをキャプチャするのに十分な品質を提供することができます。また、組み込みのメモリにより、外出先で大量のドキュメント、新聞、本、通りの標識、その他のテキストをデジタル化することがこれまで以上に簡単になります。必要なのは、これらの写真を機械可読テキストに変換する適切なテクノロジーだけです。

私たちのC#OCRライブラリは、すべてのタイプの画像をすぐに認識するように特別に設計されており、低品質の写真を処理するためにさらに微調整できます。最新のスマートフォンと組み合わせることで、ほとんどの日常的なスキャンとテキスト認識タスクに合わせて強力なOCRアプリケーションを作成できます。最も高度な画像処理とドキュメント構造分析は、数行のコードで実行されるため、複雑な数学的アルゴリズム、ニューラルネットワーク、その他の技術的複雑さではなく、ビジネスに集中できます。

写真OCR -C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

スキャンから検索可能なPDFを作成します

PDFは、特に複数のページを単一のファイルに結合する機能により、紙のドキュメントをスキャンするための最も人気のある形式の1つです。この形式は、契約、請求書、法的文書、パスポート、IDカードの交換、および個人、企業、銀行、政府機関間のその他の多くの文書の交換に広く使用されています。ただし、スキャンされたPDFは本質的に画像のコレクションです。機械読み取り可能なテキストは含まれていないため、ユーザーはドキュメントコンテンツを検索、コピー、または操作することはできません。

Aspose .Net OCRは、スキャンされたPDFを完全に検索可能でインデックス可能なドキュメントに変換するための高速で簡単で非常に信頼性の高い方法を提供します。ページコンテンツを正確に認識し、選択、コピー、テキストへのスピーチソフトウェアで読み取り、翻訳者、サマリザー、その他のAI駆動型分析ツールによって自動的に処理される可能性のある元の画像上の機械読み取り可能なテキストレイヤーに変換します。

PDFにテキストオーバーレイを追加-C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

画像でテキストを検索します

特に大規模な組織のデジタルアーカイブは、多くの場合、スキャンと写真の膨大なコレクションで構成されています。その多くには、複数ページのドキュメントが含まれている場合があります。このようなアーカイブの効率的な管理と組織は、簡単な情報検索とナビゲーションに効果的に不可欠です。ただし、画像には機械可読テキストが含まれていないため、ドキュメントコンテンツを検索および分析することは不可能です。

C#OCRライブラリを使用すると、フォント、テキストサイズ、スタイル、その他のパラメーターに関係なく、画像内のテキストを簡単に検索できます。図書館は、ケースに依存しない検索と正規表現もサポートしています。これは、さまざまなアプリケーションや業界で非常に役立ちます。この機能は、テキストにあるコンテンツ、キーワード、またはパターンに基づいてドキュメントを分類するために使用できます。契約および契約内の特定の条件または条項を検索する。それらにあるキーワードまたはコンテンツに基づいてファイルを再編成します。ドキュメント内の個人データを見つけて識別し、GDPRコンプライアンスを確保し、機密情報をより効果的に管理しやすくします。また、画像を検索することで、自動化されたワークフローを作成し、署名された契約や請求書を受け取ると、さまざまなビジネスプロセスを合理化できます。

画像でテキストを検索する-C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

LLMを使用したAI後処理

これで、生の認識を超えて、AI駆動型ロジックを適用してOCRの結果のテキスト品質を向上させることができます。大規模な言語モデル(LLMS)は、スペルエラーをインテリジェントに修正し、単語の境界を復元し、文法ルールを適用し、コンテキストに基づいてテキストを適合させることができます。これは、構文ベースのスペルチェッカーができないことです。

このポストプロセスステップは、低品質のスキャン、バックグラウンドノイズ付きの写真、または多言語ドキュメントに最適です。基本的なテキスト入力/出力をサポートするLLMパイプラインをプラグインするか、Asposeの組み込みのスマート補正ツールを使用して、生産対応の結果を得ることができます。

LLMを使用したAIポストプロセス - C#

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();