Python を使用して PDF フォームからデータを抽出します

入力可能な PDF ドキュメントからユーザーデータフィールドを抽出します。プログラムで PDF ファイルを変更するには、Aspose.PDF for Python for .NET を使用してください

Python ライブラリを使用して PDF フォームからデータを抽出する方法

PDF ファイル内の PDF フォーム (Acroforms) を抽出するには、Aspose.PDF for Python via .NET API を使用します。これは Python アプリ用の機能豊富で強力で使いやすいドキュメント操作 API です。最新バージョンは PyPI パッケージマネージャーから直接ダウンロードし、aspose-pdf を検索してインストールできます。コンソールまたはターミナルから次のコマンドを使用することもできます。

Python を使って PDF のアクロフォームを抽出する方法


ご使用の環境でコードを試すには、.NET 用の Aspose.PDF が必要です。

1。ドキュメントクラスのインスタンスに PDF をロードします。 1。Document.Form クラスを使用してすべてのフィールドから値を取得します。 1。必要に応じて名前と値を分析します。 1。ドキュメントクラスのインスタンスに PDF を読み込む 1。Document.Form クラスを使用してすべてのフィールドから値を取得します

PDF フォームからデータを抽出-Python

このサンプルコードは、Python を使用して PDF フォームからデータを抽出する方法を示しています

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)