Rust の PDF からテキストを抽出

{{製品名}} を使って PDF からテキストを抽出する方法

Rust via C++ の Aspose.PDF を使って PDF からテキストを抽出する方法

PDF を解析する必要がありますか?C++ 経由の Rust 用 Aspose.PDF は PDF ドキュメントからテキストを抽出するのに役立ちます。抽出を行うには、Aspose.PDF for Rust via C++ を使用します。これは PDF を扱うための簡単で安全なツールキットです。C++ 経由で Aspose.PDF for Go をインストールして使用するには、「ダウンロード」ボタンをクリックします。

Rust の PDF からテキストを抽出


ご使用の環境でコードを試すには、C++ 経由の Rust 用 Aspose.PDF が必要です。

  1. PDF に Document のインスタンスをロードします。
  2. TextAbSorber オブジェクトを作成してテキストを抽出します。
  3. すべてのページにアブソーバーを取り付けてください。
  4. 抽出したテキストを取得
  5. ライターを作成してファイルを開き、そのファイルにテキストを 1 行書き込む

Rust を使って PDF からテキストを抽出する

このサンプルコードは、PDF ドキュメントからテキストを抽出する方法を示しています。

Input file:

File not added

Output format:

PDF

Output file:

use asposepdf::Document;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    // Open a PDF-document with filename
    let pdf = Document::open("sample.pdf")?;

    // Return the PDF-document contents as plain text
    let txt = pdf.extract_text()?;

    // Print extracted text
    println!("Extracted text:\n{}", txt);

    Ok(())
}

Aspose.PDF for Rust via C++ API について

.NET ライブラリでは、サポートされている任意のダウンロード形式のドキュメントを、サポートされている任意の保存形式に結合できます。Aspose.PDF for .NET ライブラリには、文書結合のタスクを解決するのに役立つ、かなり汎用的なソリューションが用意されています。Aspose.PDF は、ロードと保存の両方で、最も一般的なドキュメントフォーマットを多数サポートしています。現在のセクションでは一般的なマージについてのみ説明していることに注意してください。現在のページには、TEXT から {{FILERESULT}} へのマージに関する情報が掲載されています。ただし、ファイルのマージにはさまざまな組み合わせがあります。サポートされている形式の完全なリストについては、サポートされているファイル形式 のセクションを参照してください。