Python 経由で PDF フォームからデータを抽出します

入力可能な PDF ドキュメントからユーザーデータフィールドを抽出します。プログラムで PDF ファイルを変更するには、Python for .NET の Aspose.PDF を使用してください

Python for .NET ライブラリを使用して PDF フォームからデータを抽出する方法

PDF フォーム (Acroforms) から PDF ファイルにデータを抽出するには、python-net プラットフォーム用の機能豊富で強力で使いやすいドキュメント操作 API である Aspose.PDF for .NET API を使用します。最新バージョンは NuGet パッケージマネージャーから直接ダウンロードし、Aspose.pdf を検索してインストールできます。パッケージマネージャーコンソールから次のコマンドを使用することもできます。

Python を使って PDF からアクロフォームを抽出する方法


お使いの環境でコードを試すには Aspose.PDF for .NET が必要です。

  1. Document クラスのインスタンスにPDFをロードします。
  2. Document.Form クラスを使用して、すべてのフィールドから値を取得します。
  3. 必要に応じて名前と値を分析します。
  4. Document クラスのインスタンスにPDFをロードする
  5. Document.Form クラスを使用してすべてのフィールドから値を取得する

PDF フォームからデータを抽出-Python

このサンプルコードは、Python を使用して PDF フォームから PDF フォームからデータを抽出する方法を示しています

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)