Python を使って PDF からテーブルを抽出
PDF ドキュメントからテーブルを抽出します。プログラムで PDF ファイルを変更するには、Aspose.PDF for Python for .NET を使用してください
Python for .NET ライブラリを使用して PDF ドキュメントからテーブルを抽出する方法
テーブルを抽出するために、python-net プラットフォーム用の機能豊富で強力で使いやすいドキュメント操作 API である Aspose.PDF for .NET API を使用します。NuGet パッケージマネージャーを開き、aspose.pdf を検索してインストールします。パッケージマネージャーコンソールから次のコマンドを使用することもできます。
Python を介して PDF からテーブルを抽出
お使いの環境でコードを試すには Aspose.PDF for .NET が必要です。
- Document のインスタンスを持つ PDF を読み込みます。
- テーブルを検索する TableAbsorber オブジェクトを作成します。
- アブソーバー付きの最初のページをご覧ください。
- ページ上の最初のテーブルを取得します。
- テーブルを取り外します。ファイルを保存します。