JavaScript の PDF からテキストを抽出

Node.js via C++ ライブラリを使用して PDF からテキストを抽出する方法

Node.js via C++ ライブラリを使用して PDF からテキストを抽出する方法

テキスト PDF ファイルを抽出するには、nodejs-cpp プラットフォーム向けの機能豊富で強力で使いやすいドキュメント操作 API である Aspose.PDF for .NET API を使用します。NuGet パッケージマネージャーを開き、Aspose.PDF を検索してインストールします。パッケージマネージャーコンソールから以下のコマンドを使用することもできます。

JavaScript の PDF からテキストを抽出


ご使用の環境でコードを試すには Aspose.PDF ライブラリ が必要です。

1。PDF に Document のインスタンスをロードします。 1.TextAbSorber オブジェクトを作成してテキストを抽出します。 1.すべてのページにアブソーバーを取り付けてください。 1.抽出したテキストを取得 1。ライターを作成してファイルを開き、そのファイルにテキストを 1 行書き込む

PDF からテキストを抽出-JavaScript

このサンプルコードは、PDF ドキュメントからテキストを抽出する方法を示しています。

Input file:

File not added

Output format:

PDF

Output file:

const AsposePdf = require('../AsposePDFforNode.js');
const pdf_file = '../ReadMe.pdf';
AsposePdf().then(AsposePdfModule => {
    /*Extract text from a PDF-file*/
    const json = AsposePdfModule.AsposePdfExtractText(pdf_file);
    console.log("AsposePdfExtractText => %O", json.errorCode == 0 ? json.extractText : json.errorText);
});

Node.js via C++ API の Aspose.PDF について

当社の.NET Libraryは、サポートされているダウンロード形式のドキュメントを、サポートされている任意の保存形式に結合できます。Aspose.PDF for .NET ライブラリには、ドキュメントを結合するタスクを解決するのに役立つ、かなり汎用性の高いソリューションが用意されています。Aspose.PDF は、読み込みと保存の両方において、一般的な文書形式を最も多くサポートしています。この節では一般的なマージについてのみ説明していることに注意してください。現在のページには TEXT から {{FILERESULT}} へのマージに関する情報が掲載されています。ただし、ファイルのマージにはさまざまな組み合わせがあります。サポートされている形式の一覧については、サポートされているファイル形式 のセクションを参照してください。