Supprimer les pièces jointes du PDF via Python

Supprimez les pièces jointes du PDF par programme avec Python

Comment supprimer des pièces jointes à l'aide de la bibliothèque Python for .NET

Supprimez les pièces jointes du PDF à l’aide du fichier Aspose.PDF pour Python via .NET. Les fichiers contenant des pièces jointes, tels que des images ou d’autres fichiers PDF, peuvent augmenter la taille d’un document. La suppression des pièces jointes peut contribuer à réduire la taille du fichier, ce qui facilite son partage et son stockage. De plus, les pièces jointes peuvent contenir des informations confidentielles que vous ne souhaitez pas partager avec d’autres personnes. Supprimez donc les pièces jointes du PDF. La suppression des pièces jointes permet de protéger vos données. Les pièces jointes malveillantes peuvent présenter des risques de sécurité. La suppression des pièces jointes inconnues ou non fiables du PDF permet de prévenir les menaces de sécurité potentielles. La suppression des pièces jointes facilite l’impression et la visualisation du document au format PDF. Nous pouvons conclure que la suppression des pièces jointes d’un PDF peut rendre le document plus convivial, efficace et compatible. Afin de supprimer les pièces jointes d’un fichier PDF, nous utiliserons l’API Aspose.PDF pour .NET qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez-le. Vous pouvez également utiliser la commande suivante depuis la console Package Manager.

Python Package Manager Console

pip install aspose-pdf

Supprimer les pièces jointes du PDF


Vous avez besoin de Aspose.PDF pour .NET pour essayer le code dans votre environnement.

  1. Ouvrez le PDF existant.
  2. Supprimez toutes les pièces jointes.
  3. Enregistrez le résultat.

Cet extrait de code supprime par programmation toutes les pièces jointes d’un document PDF et enregistre le PDF modifié dans un fichier distinct. Il initialise un objet « PDFDocument », qui est associé au fichier PDF situé dans le chemin « DataDir + DeleteAllAttachments.pdf ». Après avoir ouvert le document PDF, le code indique au logiciel de supprimer toutes les pièces jointes contenues dans ce fichier PDF. Les pièces jointes d’un PDF peuvent inclure des fichiers intégrés, tels que des images ou d’autres documents. Le code modifie la variable « DataDir » pour stocker le chemin où le fichier PDF mis à jour, sans aucune pièce jointe, sera enregistré. Le PDF mis à jour sera enregistré sous le nom de fichier « DeleteAllAttachments_out.pdf ».

Supprimer la pièce jointe d'un document PDF

Cet exemple de code montre comment supprimer une pièce jointe d'un PDF - Python

def attachment_remove(self, infile, outfile):

    # Open document
    path_infile = self.dataDir + infile
    path_outfile = self.dataDir + outfile
    pdfDocument = Document(path_infile)

    # Delete all attachments
    pdfDocument.EmbeddedFiles.Delete()

    # Save updated file
    pdfDocument.Save(path_outfile)