Python を使用して PDF から添付ファイルを削除する

Python を使用して PDF から添付ファイルをプログラムで削除する

Python for .NET ライブラリを使用して添付ファイルを削除する方法

.NET 経由の Python 用 Aspose.PDF を使用して PDF から添付ファイルを削除します。画像やその他の PDF など、添付ファイルがあると、文書のサイズが大きくなることがあります。添付ファイルを削除すると、ファイルサイズが小さくなり、共有や保存が容易になる場合があります。また、添付ファイルには、他の人と共有したくない機密情報が含まれている場合があります。そのため、PDF から添付ファイルを削除してください。添付ファイルを削除すると、データを保護するのに役立ちます。悪意のある添付ファイルはセキュリティ上のリスクをもたらす可能性があります。PDF から未知の添付ファイルや信頼できない添付ファイルを削除すると、潜在的なセキュリティ上の脅威を防ぐのに役立ちます。添付ファイルを削除すると、PDF 文書の印刷や表示が容易になります。結論として、PDF から添付ファイルを削除すると、文書の使いやすさ、効率性、互換性が向上するということです。PDF ファイル内の添付ファイルを削除するには、python-net プラットフォーム向けの機能が豊富で強力で使いやすいドキュメント操作 API である Aspose.PDF for .NET API を使用します。NuGet パッケージマネージャーを開き、Aspose.pdf を検索してインストールします。パッケージマネージャーコンソールから次のコマンドを使用することもできます。

Console

pip install aspose-pdf

PDF から添付ファイルを削除


ご使用の環境でコードを試すには Aspose.PDF for .NET が必要です。

  1. 既存の PDF を開きます。
  2. 添付ファイルをすべて削除します。
  3. 結果を保存します。

このコードスニペットは、プログラムによって PDF ドキュメントからすべての添付ファイルを削除し、変更された PDF を別のファイルとして保存します。これにより、「DataDir+ DeleteAllAttachments.pdf」パスにある PDF ファイルに関連付けられた「PDFDocument」オブジェクトが初期化されます。PDF ドキュメントを開くと、コードはこの PDF ファイルに含まれる添付ファイルをすべて削除するようにソフトウェアに指示します。PDF の添付ファイルには、画像やその他の文書などの埋め込みファイルが含まれる場合があります。このコードでは、「DataDir」変数を変更して、更新された PDF ファイル (添付ファイルなし) を保存するパスを格納します。更新された PDF は ‘DeleteAllAttachments_out.pdf’ というファイル名で保存されます。

PDF ドキュメントから添付ファイルを削除

このサンプルコードは、PDF から添付ファイルを削除する方法を示しています-Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
path_outfile  = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
document.embedded_files.delete_by_key("rfc822.txt")
document.save(path_outfile)