Biffure des formats PDF en Python

Informations de biffure sensibles aux documents PDF natives et hautes performances à l’aide de Aspose.PDF côté serveur pour les API Python, sans utiliser de logiciel tel que Microsoft ou Adobe PDF.

Comment biffer un fichier PDF à l'aide de la bibliothèque Python

Afin de biffer un fichier PDF, nous utiliserons l’API Aspose.PDF for .NET qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages.

Biffure des documents PDF via Python


Vous devez Aspose.PDF for .NET essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un objet TextFragmentAbsorber avec des termes de recherche en argument.
  3. Définissez les options de recherche.
  4. Passez en boucle chaque fragment collecté pour biffer.
  5. Enregistrez le fichier PDF.

Biffure des fichiers PDF - Python


    doc = new Document(dataDir + "test.pdf")

    textFragmentAbsorber = TextFragmentAbsorber(searchTerm)
    textSearchOptions = TextSearchOptions(True)
    textFragmentAbsorber.TextSearchOptions = textSearchOptions

    doc.Pages.Accept(textFragmentAbsorber)
    textFragmentCollection = textFragmentAbsorber.TextFragments
    for textFragment in textFragmentCollection:
        page = textFragment.Page
        annotationRectangle = textFragment.Rectangle
        RedactionAnnotation annot = Annotations.RedactionAnnotation(page, annotationRectangle)
        annot.FillColor = Color.Black
        doc.Pages[textFragment.Page.Number].Annotations.Add(annot, true)
        annot.Redact()

        doc.Save(dataDir + "output.pdf")