Remover anexos do PDF via Python

Exclua anexos do PDF programaticamente com Python

Como remover anexos usando a biblioteca Python for .NET

Remova anexos do PDF usando o Aspose.PDF para Python via .NET. Arquivos com anexos, como imagens ou outros PDFs, podem aumentar o tamanho de um documento. A remoção de anexos pode ajudar a reduzir o tamanho do arquivo, facilitando o compartilhamento e o armazenamento. Além disso, os anexos podem conter informações confidenciais que você não deseja compartilhar com outras pessoas. Portanto, exclua os anexos do PDF. A remoção de anexos ajuda a proteger seus dados. Anexos maliciosos podem representar riscos de segurança. A remoção de anexos desconhecidos ou não confiáveis do PDF ajudará a evitar possíveis ameaças à segurança. A remoção de anexos facilita a impressão e a visualização do PDF. Podemos concluir que a remoção de anexos do PDF pode tornar o documento mais fácil de usar, eficiente e compatível. Para remover anexos em um arquivo PDF, usaremos a API Aspose.PDF for.NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma python-net. Abra o gerenciador de pacotes NuGet, pesquise Aspose.pdf e instale. Você também pode usar o seguinte comando no console do gerenciador de pacotes.

Python Package Manager Console

pip install aspose-pdf

Remover anexos do PDF


Você precisa do Aspose.PDF para .NET para testar o código em seu ambiente.

  1. Abra o PDF existente.
  2. Exclua todos os anexos.
  3. Salve o resultado.

Esse trecho de código remove programaticamente todos os anexos de um documento PDF e salva o PDF modificado como um arquivo separado. Ele inicializa um objeto ‘PDFDocument’, que está associado ao arquivo PDF localizado no caminho ‘DataDir + deleteAllAttachments.pdf’. Depois de abrir o documento PDF, o código instrui o software a excluir todos os anexos contidos nesse arquivo PDF. Os anexos em um PDF podem incluir arquivos incorporados, como imagens ou outros documentos. O código modifica a variável ‘dataDir’ para armazenar o caminho em que o arquivo PDF atualizado, sem anexos, será salvo. O PDF atualizado será salvo com o nome de arquivo ‘DeleteAllAttachments_out.pdf.’

Excluir anexo do documento PDF

Este exemplo de código mostra como remover anexos de um PDF - Python

def attachment_remove(self, infile, outfile):

    # Open document
    path_infile = self.dataDir + infile
    path_outfile = self.dataDir + outfile
    pdfDocument = Document(path_infile)

    # Delete all attachments
    pdfDocument.EmbeddedFiles.Delete()

    # Save updated file
    pdfDocument.Save(path_outfile)