WEB ページに OCR を追加する - JavaScript - Electron
WEBサイトのOCR
その他のショーケース >var input = Module.WasmAsposeOCRInput();
var inputs = new Module.WasmAsposeOCRInputs();
// Prepare settings
var settings = Module.WasmAsposeOCRRecognitionSettings();
input.url = "<file name>";
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Serrialize result
var result_str = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(result_str);
C++ 経由の JavaScript に Aspose.OCR を選択する理由
C++ 経由の JavaScript 用 Aspose.OCR を使用すると、Web ページ上またはクロスプラットフォームの Electron アプリから直接、スキャンしたページ、写真、スクリーンショット、その他の画像からテキストを抽出できます。これは WebAssembly (Wasm) テクノロジーに基づいており、Web サーバーを必要とせずにエンド ユーザーのデバイス上でコードを実行できます。すべての Web ブラウザ機能へのアクセスを含め、JavaScript コンテキストにネイティブに統合できます。 Aspose.OCR for JavaScript via C++ は、Web に埋め込まれた場合に最高のセキュリティを提供し、ブラウザの同一オリジンおよびアクセス許可のセキュリティ ポリシーを強制します。
当社の強力で機能豊富な光学式文字認識 (OCR) API は、ラテン語、キリル文字、および中国語やヒンディー語を含むアジア文字に基づく 130 以上の言語をサポートし、最も一般的な形式のファイルを認識できます。さまざまな処理フィルターを使用すると、歪んだ画像、歪んだ画像、ノイズのある画像を認識できます。認識結果は、最も一般的なデータ交換形式で返されます。
高速かつ正確な OCR
C++ テクノロジーを介した高度な JavaScript により、高速かつ正確な OCR 結果を実現します。
多言語サポート
ラテン語、キリル文字、アラビア語、ペルシア語、インド語、中国語の文字を含む 130 以上の言語のテキストを認識し、C++ 統合を通じて JavaScript アプリケーションの汎用性を確保します。
多彩な画像サポート
C++ 経由の JavaScript を使用して、スキャナー、カメラ、スマートフォンからの画像を簡単に処理します。
漢字認識の精度
C++ を介して JavaScript プロジェクトで 6,000 を超える漢字を正確に認識します。
レイアウト検出
画像内のコンテンツ ブロックを識別して分類し、レイアウトに関係なく、抽出されたテキストの正しい順序を確保します。
ライブコードサンプル
わずか 3 行のコードで画像からのテキスト認識を開始します。シンプルさを体験してください!
* ファイルをアップロードするかサービスを使用することにより、次のことに同意したことになります。 利用規約 そして プライバシーポリシー.
画像をテキストに変換する
他の例 >const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
var inputs = new Module.WasmAsposeOCRInputs();
var settings = Module.WasmAsposeOCRRecognitionSettings();
input.url = filename;
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Get recognition results as text
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);
WEBアプリケーションへのOCR統合
Aspose.OCR for JavaScript を使用すると、エンド ユーザーの Web ブラウザ (クライアント側) または Electon などのブラウザ ベースの環境でコードを直接実行できます。
サポートされているファイル形式
Aspose.OCR for Javascript via C++ 事実上あらゆる[ファイル]を扱うことができます( https://docs.aspose.com/ocr/javascript-cpp/supported-file-formats/ ) スキャナーやカメラから取得できます。認識結果は、最も一般的なファイルおよびデータ交換形式で返され、保存、データベースへのインポート、またはリアルタイムでの分析が可能です。
画像
- JPEG
- PNG
- TIFF
- BMP
バッチOCR
- ZIP
認識結果
- Text
- JSON
- XML
簡単な取り付け
C++ 経由の JavaScript 用 Aspose.OCR は、外部依存関係をインストールする必要のない自己完結型のダウンロード可能なパッケージとして配布されます。 HTML ページの横で解凍するだけで、ブラウザ内で画像をテキストに変換する準備が整います。
試用版ライセンスをリクエスト して、制限なく完全に機能する OCR アプリケーションの開発を開始します。
130 以上の認識言語
JavaScript OCR API は、混合言語を含む 130 以上の言語と一般的なスクリプトを認識します。
言語検出をライブラリに任せるか、認識パフォーマンスと信頼性を向上させるために自分で言語を定義します。
- 拡張ラテン語 アルファベット: 英語、スペイン語、フランス語、インドネシア語、ポルトガル語、ドイツ語、ベトナム語、トルコ語、イタリア語、ポーランド語、その他 80 以上。
- キリル文字 アルファベット: ロシア語、ウクライナ語、カザフ語、セルビア語、ベラルーシ語、ブルガリア語。
- アラビア語、ペルシア語、ウルドゥー語。
- 中国語およびデーヴァナーガリー文字(ヒンディー語、マラーティー語、ボージプリ語などを含む)。
あらゆるコンテンツに適しています
JavaScript OCR API は、混合言語を含む 130 以上の言語と一般的なスクリプトを認識します。
言語検出をライブラリに任せるか、認識パフォーマンスと信頼性を向上させるために自分で言語を定義します。
主な特長
Aspose.OCR for Javascript via C++ Aspose.OCR for JavaScript の高度な機能を調べてください。
写真OCR
スキャンレベルの精度でスマートフォンの写真からテキストを抽出します。
検索可能なPDF
あらゆるスキャンを完全に検索可能でインデックス可能なドキュメントに変換します。
URL認識
画像をローカルにダウンロードせずに、URL から画像を認識します。
一括認識
複数ページのドキュメント、フォルダー、アーカイブからすべての画像を読み取ります。
任意のフォントとスタイル
すべての一般的な書体とスタイルのテキストを識別して認識します。
認識を微調整する
最良の認識結果が得られるように、すべての OCR パラメータを調整します。
JavaScript コードサンプル
C++ 経由で Aspose.OCR for JavaScript を HTML ページや Electron アプリにシームレスに統合するコード サンプルをご覧ください。
JavaScript の簡単なインストール
JavaScriptによる画像認識
OCR アプリケーションの普及は通常、ほとんどのユーザーにとってスキャナが一般的ではないという事実によって阻止されます。当社の OCR ライブラリには、暗い画像、回転した画像、歪んだ画像、ノイズの多い画像を処理できる強力な画像前処理フィルタが組み込まれています。すべての画像形式のサポートと組み合わせることで、スマートフォンの写真でも確実に認識できます。前処理と画像補正のほとんどは自動的に行われるため、難しい場合にのみ介入する必要があります。
自動画像補正を適用する - JavaScript
// Load photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Automatically adjust contrast and remove noise
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.PHOTO;
settings.auto_contrast = true;
settings.auto_denoising = true;
// Extract text from photo:
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
// Output recognition results
var result_str = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
console.log(result_str);
JavaScript 用のユニバーサル画像からテキストへのコンバーター
多くの企業、組織、個人が紙の文書への依存を減らすことに積極的に取り組んでいますが、これは依然として保存と共有の最も普及した形式です。物理アーカイブにバックアップされたスキャンされたドキュメントは、法規制への準拠、法的目的、長期的なバックアップおよび冗長性には十分です。ただし、スキャンされた既存のコンテンツまたは既存のドキュメントの一部に基づいて新しいコンテンツを作成するビジネス ケースが頻繁に発生します。 С++ 経由の Aspose.OCR for JavaScript を使用すると、スキャンしたページを検索および編集可能なテキストに簡単に変換できます。コンテンツは高い精度と速度で認識されるため、手動で入力する時間と労力が節約され、特に大量の情報を扱う場合に人的エラーが発生しません。
画像をドキュメントに変換 - JavaScript
// Load a scanned page from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Analyze content structure
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.DOCUMENT;
settings.upscale_small_font = true;
// Extract text from a page
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);
テーブルから数値データを抽出する
野外社会調査の生データや在庫リストなど、数値データを含む大きな印刷された表を管理する場合、手動による抽出は時間がかかり、人的ミスが非常に発生しやすい非現実的なプロセスになります。 OCR は、情報抽出の自動化と標準化に役立ち、一貫性と信頼性の高い結果を保証します。 Aspose.OCR for JavaScript via С++ は、スキャンまたは写真で撮影された表形式データの機械可読コンテンツへの変換を完全に自動化します。抽出されたデータはデータベースに簡単に統合して分析できるため、より多くの情報に基づいた意思決定に貢献します。
表の画像をテキストに変換 - JavaScript
// Load a scan or photo from user input
const fileData = new Uint8Array(e.target.result);
let filename = file.name;
let stream = Module.FS.open(filename, "w+");
Module.FS.write(stream, fileData, 0, fileData.length, 0);
Module.FS.close(stream);
var input = Module.WasmAsposeOCRInput();
input.url = filename;
// Analyze tabular structures
var settings = Module.WasmAsposeOCRRecognitionSettings();
settings.detect_areas_mode = Module.DetectAreasMode.TABLE;
// Limit the subset of characters to improve recognition accuracy and increase performance
settings.alphabet = "1234567890.,;";
// Extract text from a table
var inputs = new Module.WasmAsposeOCRInputs();
inputs.push_back(input);
var result = Module.AsposeOCRRecognize(inputs, settings);
var editableText = Module.AsposeOCRSerializeResult(result, Module.ExportFormat.text);