Supprimer des tableaux du document PDF via Python

Comment supprimer un tableau d’un PDF à l’aide de la bibliothèque Python

Comment supprimer des tableaux d'un document PDF à l'aide de la bibliothèque Python for .NET

Afin de supprimer le tableau, nous utiliserons l’API Aspose.PDF for .NET qui est une API de manipulation de documents riche en fonctionnalités, puissante et facile à utiliser pour la plate-forme python-net. Ouvrez le gestionnaire de packages NuGet, recherchez Aspose.pdf et installez. Vous pouvez également utiliser la commande suivante depuis la console du gestionnaire de packages.

Python Package Manager Console

pip install aspose-pdf

Supprimer des tableaux du PDF via Python


Vous devez Aspose.PDF for .NET essayer le code dans votre environnement.

  1. Chargez le PDF avec une instance de Document.
  2. Créez un objet TableAbsorber pour rechercher des tables.
  3. Visitez la première page avec absorbeur.
  4. Obtenez le premier tableau de la page.
  5. Enlevez la table. Enregistrez le fichier.

Supprimer les tableaux du PDF - Python

    import aspose.pdf as ap

    input_file = DIR_INPUT_TABLE + "Table_input.pdf"
    output_file = DIR_OUTPUT + "Table_out.pdf"
    # Load existing PDF document
    pdf_document = ap.Document(input_file)
    # Create TableAbsorber object to find tables
    absorber = ap.text.TableAbsorber()
    # Visit first page with absorber
    absorber.visit(pdf_document.pages[1])
    # Get first table on the page
    table = absorber.table_list[0]
    # Remove the table
    absorber.remove(table)
    # Save PDF
    pdf_document.save(output_file)