JavaScript 経由で PDF を抽出

Node.js via C++ ライブラリを使用して PDF からテキストと画像を抽出する方法

C# Java C++ Python

Parser で最もよく使われるアクション

テキストを抽出

画像を抽出

フォントを抽出

Node.js via C++ ライブラリで PDF を解析する方法

PDF を解析する必要がありますか?C++ 経由の Aspose.PDF for Node.js は PDF ドキュメントからテキストや画像を抽出するのに役立ちます。抽出を行うには、Aspose.PDF for Node.js via C++ を使用します。これは PDF を扱うための簡単で安全なツールキットです。C++ 経由で Aspose.PDF for Node.js をインストールして使用するには、ZIP アーカイブからファイルを抽出します。

JavaScript 経由で PDF を解析

お使いの環境でコードを試すには、C++ 経由の Node.js 用 Aspose.PDF が必要です。

PDF に Document のインスタンスをロードします。
TextAbsorber オブジェクトを作成してテキストを抽出します。
すべてのページのアブソーバーを受け入れます。
抽出したテキストを取得
ライターを作成してファイルを開き、ファイルに 1 行のテキストを書き込む

PDF ファイルの抽出-JavaScript

このサンプルコードは、PDF ドキュメントを抽出する方法を示しています。

Input file:

Upload a file

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Aspose.PDF for Node.js via C++ API について

C++ 経由の Aspose.PDF for Node.js では、開発者が PDF ファイルを操作できます。この JavaScript ソリューションは WebAssembly テクノロジーを使用して構築されており、Aspose.PDF for C++ をベースにしています。Aspose.Pdf for Node.js は C++ から簡単に使用でき、インストール手順に従うこともできます。Aspose.PDF for Node.js は、次のようなさまざまな機能をサポートしています。

PDF ドキュメントを最適化します。
PDF ファイルにスタンプを追加します。
PDF ファイルを結合します。
PDF を 2 つのファイルに分割します。
PDF を DOCX、XLSX、JPEG、PNG、TIFF、BMP、SVG、SVG (ZIP)、XPS、TXT などに変換します。

C++ API による Aspose.PDF for Node.js の詳細については、API の使用方法に関する当社のドキュメントを参照してください。