JavaScript の PDF からテキストを抽出

{{製品名}} を使って PDF からテキストを抽出する方法

JavaScript via C++ の Aspose.PDF を使って PDF からテキストを抽出する方法

PDFからテキストを抽出する必要がありますか?C++ 経由の JavaScript 用 Aspose.PDF は PDF ドキュメントからテキストを抽出するのに役立ちます。抽出には、Aspose.PDF for JavaScript via C++ を使用します。これは、Web ブラウザーで PDF を直接操作するための簡単で安全なツールキットです。C++ 経由で Aspose.PDF for JavaScript をインストールして使用するには、ZIP アーカイブ からファイルを抽出します。

JavaScript の PDF からテキストを抽出


ご使用の環境でコードを試すには、C++ 経由の JavaScript 用 Aspose.PDF が必要です。

  1. PDF に Document のインスタンスをロードします。
  2. TextAbSorber オブジェクトを作成してテキストを抽出します。
  3. すべてのページにアブソーバーを取り付けてください。
  4. 抽出したテキストを取得
  5. ライターを作成してファイルを開き、そのファイルにテキストを 1 行書き込む

JavaScript を使って PDF からテキストを抽出する

このサンプルコードは、PDF ドキュメントからテキストを抽出する方法を示しています。

Input file:

File not added

Output format:

PDF

Output file:


    var ffileExtract = function (e) {
        const file_reader = new FileReader();
        file_reader.onload = (event) => {
        /*Extract text from a PDF-file*/
        const json = AsposePdfExtractText(event.target.result, e.target.files[0].name);
        if (json.errorCode == 0) document.getElementById('output').textContent = json.extractText;
        else document.getElementById('output').textContent = json.errorText;
        };
        file_reader.readAsArrayBuffer(e.target.files[0]);
    };

Aspose.PDF for JavaScript via C++ API について

C++ 経由の JavaScript 用 Aspose.PDF を使用すると、開発者はそれらを Web で直接 PDF ファイルを操作できます。この JavaScript ソリューションは WebAssembly テクノロジーを使用して構築されており、.NET Lightweight 用 Aspose.PDF をベースにしています。aspose-pdf for JavaScript は C++ から簡単に使用でき、インストール手順に従ってください。Aspose.PDF for JavaScript は、次のようなさまざまな機能をサポートしています。

  • PDF ドキュメントを最適化します。
  • PDF ファイルにスタンプを追加します。
  • PDF ファイルを結合します。
  • PDF を 2 つのファイルに分割します。
  • PDFをDOCX、XLSX、JPEG、PNG、TIFF、BMP、SVG、SVG (ZIP)、XPS、TXT などに変換します。

C++ API 経由の Aspose.PDF for JavaScript の詳細については、API の使用方法に関する ドキュメント を参照してください。