C++ ライブラリを使用した画像からテキストへの変換
画像をテキストに変換する
その他のショーケース >AsposeOCRInput source;
source.url = file_path_str.c_str();
vector<AsposeOCRInput> content = {source};
// Extract text from the image
AsposeOCRRecognitionResult result
= asposeocr_recognize(content.data(), content.size());
// Output the recognized text
size_t size = 0;
wchar_t* result = asposeocr_serialize_result(result, size);
> Install-Package Aspose.Ocr.Cpp
C++ に Aspose.OCR を使用する理由
オンプレミス アプリケーション、Web サービス、またはクラウドで、あらゆるレイアウトと複雑さの機械可読フォームを作成して認識します。当社のソリューションは、簡単なアンケートやクイズから最終試験や選挙まで、あらゆる規模のプロジェクトに適しています。当社の機能とメリットの詳細については、以下の項目をクリックしてください。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
あらゆるスキャンを完全に検索可能でインデックス可能なドキュメントに変換します。
URL認識
画像をローカルにダウンロードせずに、URL から画像を認識します。
一括認識
複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
任意のフォントとスタイル
すべての一般的な書体とスタイルのテキストを識別して認識します。
ライブコードサンプル
シンプルさを体験してください: わずか 3 行の C++ コードで画像をテキストに変換します。
* ファイルをアップロードするかサービスを使用することにより、当社の 利用規約 そして プライバシーポリシー.
画像をテキストに変換する
他の例を見つける > string file = "source.png";
AsposeOCRInput source;
source.url = file.c_str();
vector<AsposeOCRInput> content = {source};
RecognitionSettings settings;
settings.language_alphabet = language::eng;
size_t size = 0;
wchar_t* buffer = asposeocr_serialize_result(result, size);
wcout << wstring(buffer) << endl;
asposeocr_free_result(result);
どこでも C++ パワーを発揮
Aspose.OCR for C++ は、あらゆるプラットフォームでシームレスに動作します。
サポートされているファイル形式
Aspose.OCR for C++ 任意の[ファイル]を操作できます( https://docs.aspose.com/ocr/cpp/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は保存したり、データベースにインポートしたり、リアルタイムで分析したりできます。
画像
- JPEG
- PNG
- TIFF
- BMP
バッチOCR
- Multi-page PDF
- ZIP
- Folder
認識結果
- Text
- Microsoft Word
- Microsoft Excel
- RTF
- JSON
- XML
インストール
C++ 用の Aspose.OCR ライブラリは、NuGet パッケージとして、または依存関係を最小限に抑えた ダウンロード可能なファイル として配布されます。これをプロジェクトに簡単に インストール するだけで、サポートされている複数の言語でテキストを認識し、認識結果をさまざまな形式で保存できるようになります。
試用ライセンスをリクエスト して、制限なしで完全に機能する OCR アプリケーションの開発を開始します。
全体的な C++ パワー
当社のライブラリは C++11 以降を完全にサポートしており、デスクトップ Windows、Windows Server、macOS、Linux、クラウドなど、あらゆるプラットフォームでアプリケーションをシームレスに実行できます。
130 以上の認識言語
当社の C++ OCR API は、混合言語を含む、多数の言語と一般的なスクリプトを認識します。
言語検出をライブラリに任せるか、認識パフォーマンスと信頼性を向上させるために自分で言語を定義します。
- 拡張ラテン語 アルファベット: 英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、その他 80 以上。
- キリル文字 アルファベット: ロシア語、ウクライナ語、カザフ語、セルビア語、ベラルーシ語、ブルガリア語。
- アラビア語、ペルシア語、ウルドゥー語。
- 中国語およびデーヴァナーガリー文字(ヒンディー語、マラーティー語、ボージプリ語などを含む)。
力を与える機能と機能
Aspose.OCR for C++ Aspose.OCR for C++ の高度な機能と機能をご覧ください。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
あらゆるスキャンを完全に検索可能でインデックス可能なドキュメントに変換します。
URL認識
画像をローカルにダウンロードせずに、URL から画像を認識します。
一括認識
複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
任意のフォントとスタイル
すべての一般的な書体とスタイルのテキストを識別して認識します。
認識を微調整する
最良の認識結果が得られるように、すべての OCR パラメータを調整します。
スペルチェッカー
スペルミスの単語を自動的に修正することで結果を改善します。
画像内のテキストを検索する
一連の画像内のテキストまたは正規表現を検索します。
画像テキストを比較する
大文字と小文字やレイアウトに関係なく、2 つの画像上のテキストを比較します。
認識範囲を制限する
OCR エンジンが検索する文字のセットを制限します。
画像欠陥の検出
画像内で問題がある可能性のある領域を自動的に検出します。
領域を認識する
すべてのテキストではなく、画像の特定の領域のみを検索して読み取ります。
C++ コードサンプル
コード サンプルを詳しく調べて、Aspose.OCR for C++ をアプリケーションにシームレスに統合します。
C++ インストールの習得
インストール後、すぐに Aspose.OCR for C++ の使用を開始できます。ただし、一定の制限があります。一時ライセンスにより、30 日間の試用版の制限がすべて解除されます。この期間を利用して完全に機能する OCR アプリケーションの開発を開始し、後の段階で Aspose.OCR for C++ を購入するかどうかについて情報に基づいた決定を下すことができます。
C++ 写真の OCR
広く普及しているスキャナが不足している OCR アプリケーションの課題を克服します。当社の API は、回転、歪み、ノイズのある画像を適切に処理する強力な組み込み画像前処理フィルターを備えています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真からも確実に認識されます。ほとんどの前処理と画像補正は自動化されており、困難な場合にのみユーザーの介入が必要になります。また、操作する画像領域を事前に定義することもできます。
スキュー補正のカスタム角度を設定し、認識領域を定義する - C++
string file = "photo.png";
AsposeOCRInput source;
source.url = file.c_str();
std::vector<AsposeOCRInput> content = { source };
// Fine-tune recognition
RecognitionSettings settings;
settings.detect_areas_mode = detect_areas_mode_enum::PHOTO;
// Extract text from the photo
auto result = asposeocr_recognize(content.data(), content.size(), settings);
// Output the recognized text
wchar_t* buffer = asposeocr_serialize_result(result, buffer_size, export_format::text);
std::wcout << std::wstring(buffer) << std::endl;
// Release the resources
asposeocr_free_result(result);
画像欠陥の検出
画像の欠陥は OCR の精度に大きな影響を与える可能性があります。これらは、画像取得プロセスの品質、環境条件、画像のキャプチャに使用されたハードウェアによって発生する可能性があります。認識精度を向上させるには、画像を前処理および強化して、可能な限りこれらの欠陥を軽減することが不可欠です。Aspose.OCR for C++ は、認識中に画像内の潜在的に問題のある領域を 自動的に検出 できます。画像をプレビューするときに問題のある領域を強調表示したり、別の認識設定を使用して問題領域を OCR してより良い結果を得ることができます。
ぼやけた、歪んだ、低コントラストの画像上のテキストを認識する - C++
// Provide the image
string file = "source.png";
AsposeOCRInput source;
source.url = file.c_str();
vector<AsposeOCRInput> content = {source};
// Activate detection of low-contrast areas
RecognitionSettings settings;
settings.defect_type = defect_type::ASPOSE_OCR_DETECT_DARK_IMAGES;
// Find and show low-contrast areas
AsposeOCRRecognitionResult result = asposeocr_recognize(content.data(), content.size(), settings);
for (size_t p_number = 0; p_number < result.pages_amount; ++p_number)
{
cout << "Page " << p_number << ";\n";
const auto& page = result.recognized_pages[p_number];
for (size_t defect_number = 0; defect_number < page.defects_count; ++defect_number)
{
const auto& defect_area = page.defect_areas[defect_number];
cout << "Low-contrast area " << defect_number << ":" << defect_area.area << std::endl;
}
}
// Release the resources
asposeocr_free_result(result);
バッチ処理
OCR API は、1 回の呼び出しで複数の画像を認識できるさまざまなバッチ処理メソッドを提供することで、すべての画像を 1 つずつ認識する必要がなくなります。
- 複数ページの PDF および TIFF ファイルの認識。
- フォルダー内のすべてのファイルを認識します。
- アーカイブ内のすべてのファイルの認識。
ZIP アーカイブを認識する - C++
// Provide a ZIP archive
string file = "pages.zip";
AsposeOCRInput source;
source.url = file.c_str();
std::vector<AsposeOCRInput> content = { source };
// Fine-tune recognition
RecognitionSettings settings;
settings.detect_areas_mode = detect_areas_mode_enum::COMBINE;
// Extract texts
auto result = asposeocr_recognize(content.data(), content.size(), settings);