Eliminar archivos adjuntos de un PDF a través de Python

Elimine archivos adjuntos de un PDF mediante programación con Python

Cómo eliminar archivos adjuntos mediante la biblioteca de Python for .NET

Elimine los archivos adjuntos de un PDF con Aspose.PDF para Python a través de.NET. Los archivos con archivos adjuntos, como imágenes u otros archivos PDF, pueden aumentar el tamaño de un documento. Eliminar los archivos adjuntos puede ayudar a reducir el tamaño del archivo, lo que facilita su uso compartido y almacenamiento. Además, los archivos adjuntos pueden contener información confidencial que no quieras compartir con otras personas. Por lo tanto, elimina los archivos adjuntos del PDF. Eliminar los archivos adjuntos ayuda a proteger sus datos. Los archivos adjuntos malintencionados pueden presentar riesgos de seguridad. Eliminar del PDF los archivos adjuntos desconocidos o que no sean de confianza ayudará a prevenir posibles amenazas de seguridad. La eliminación de los archivos adjuntos facilita la impresión y visualización del documento en PDF. Podemos concluir que eliminar los archivos adjuntos del PDF puede hacer que el documento sea más fácil de usar, eficiente y compatible. Para eliminar los archivos adjuntos en un archivo PDF, utilizaremos la API Aspose.PDF para .NET, que es una API de manipulación de documentos rica en funciones, potente y fácil de usar para la plataforma python-net. Abre el administrador de paquetes NuGet, busca Aspose.pdf e instálalo. También puede usar el siguiente comando desde la consola del administrador de paquetes.

Python Package Manager Console

pip install aspose-pdf

Eliminar archivos adjuntos de un PDF


Necesita Aspose.PDF para .NET para probar el código en su entorno.

  1. Abra el PDF existente.
  2. Elimine todos los archivos adjuntos.
  3. Guarda el resultado.

Este fragmento de código elimina mediante programación todos los archivos adjuntos de un documento PDF y guarda el PDF modificado como un archivo independiente. Inicializa un objeto «PDFDocument», que está asociado al archivo PDF ubicado en la ruta «DataDir + DeleteAllAttachments.pdf». Tras abrir el documento PDF, el código indica al software que elimine todos los archivos adjuntos contenidos en este archivo PDF. Los archivos adjuntos de un PDF pueden incluir archivos incrustados, como imágenes u otros documentos. El código modifica la variable «dataDir» para almacenar la ruta en la que se guardará el archivo PDF actualizado, sin ningún adjunto. El PDF actualizado se guardará con el nombre de archivo ‘DeleteAllAttachments_out.pdf’.

Eliminar el archivo adjunto del documento PDF

Este código de ejemplo muestra cómo eliminar un archivo adjunto de un PDF: Python

def attachment_remove(self, infile, outfile):

    # Open document
    path_infile = self.dataDir + infile
    path_outfile = self.dataDir + outfile
    pdfDocument = Document(path_infile)

    # Delete all attachments
    pdfDocument.EmbeddedFiles.Delete()

    # Save updated file
    pdfDocument.Save(path_outfile)