Entfernen Sie Anhänge aus PDF über Python

Löschen Sie Anlagen programmgesteuert mit Python aus PDF

So entfernen Sie Anlagen mithilfe der Python for .NET Bibliothek

Entfernen Sie Anhänge aus dem PDF mit der Datei Aspose.PDF für Python über.NET. Dateien mit Anhängen, wie Bilder oder andere PDF-Dateien, können die Größe eines Dokuments erhöhen. Das Entfernen von Anhängen kann dazu beitragen, die Dateigröße zu reduzieren, sodass sie einfacher geteilt und gespeichert werden kann. Außerdem können Anlagen vertrauliche Informationen enthalten, die Sie nicht mit anderen teilen möchten. Löschen Sie also Anlagen aus dem PDF. Das Entfernen von Anhängen schützt Ihre Daten. Bösartige Anhänge können Sicherheitsrisiken darstellen. Das Entfernen unbekannter oder nicht vertrauenswürdiger Anlagen aus PDF-Dateien hilft, potenzielle Sicherheitsbedrohungen zu vermeiden. Durch das Entfernen von Anhängen können Sie die PDF-Datei einfacher drucken und anzeigen. Wir können daraus schließen, dass das Entfernen von Anhängen aus dem PDF das Dokument benutzerfreundlicher, effizienter und kompatibler machen kann. Um Anhänge in einer PDF-Datei zu entfernen, verwenden wir die API Aspose.PDF for .NET. Dabei handelt es sich um eine funktionsreiche, leistungsstarke und benutzerfreundliche API zur Dokumentenbearbeitung für die python-net -Plattform. Öffnen Sie den Paketmanager NuGet, suchen Sie nach Aspose.pdf und installieren Sie ihn. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

Python Package Manager Console

pip install aspose-pdf

Anlagen aus PDF entfernen


Sie benötigen Aspose.PDF for .NET, um den Code in Ihrer Umgebung auszuprobieren.

  1. Öffnen Sie das vorhandene PDF.
  2. Löscht alle Anlagen.
  3. Speichern Sie das Ergebnis.

Dieser Codeausschnitt entfernt programmgesteuert alle Anlagen aus einem PDF-Dokument und speichert das geänderte PDF als separate Datei. Es initialisiert ein ‘PdfDocument’-Objekt, das mit der PDF-Datei verknüpft ist, die sich im Pfad ‘DataDir+ deleteAllAttachments.pdf’ befindet. Nach dem Öffnen des PDF-Dokuments weist der Code die Software an, alle in dieser PDF-Datei enthaltenen Anlagen zu löschen. Anlagen in einer PDF-Datei können eingebettete Dateien wie Bilder oder andere Dokumente enthalten. Der Code ändert die Variable ‘DataDir’, um den Pfad zu speichern, in dem die aktualisierte PDF-Datei ohne Anlagen gespeichert wird. Das aktualisierte PDF wird unter dem Dateinamen ‘DeleteAllAttachments_out.pdf’ gespeichert.

Anlage aus PDF-Dokument löschen

Dieser Beispielcode zeigt, wie man einen Anhang aus einer PDF-Datei entfernt - Python

def attachment_remove(self, infile, outfile):

    # Open document
    path_infile = self.dataDir + infile
    path_outfile = self.dataDir + outfile
    pdfDocument = Document(path_infile)

    # Delete all attachments
    pdfDocument.EmbeddedFiles.Delete()

    # Save updated file
    pdfDocument.Save(path_outfile)