Rimuovi tabelle dal PDF tramite Python

Elimina le tabelle dal documento PDF utilizzando Aspose.PDF per la libreria Python for .NET

Come eliminare le tabelle dal documento PDF utilizzando la libreria Python for .NET

Per eliminare la tabella, useremo l’API Aspose.PDF for .NET che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma python-net. Apri il gestore pacchetti NuGet, cerca Aspose.pdf e installa. È inoltre possibile utilizzare il seguente comando dalla console di Gestione pacchetti.

Python Package Manager Console

pip install aspose-pdf

Elimina tabelle dal PDF tramite Python


È necessario Aspose.PDF for .NET per provare il codice nel proprio ambiente.

  1. Carica il PDF con un’istanza di Document.
  2. Creare l’oggetto TableAbsorber per trovare le tabelle.
  3. Visita la prima pagina con assorbitore.
  4. Ottieni la prima tabella sulla pagina.
  5. Rimuovi la tabella. Salvate il file.

Elimina tabelle dal PDF - Python

import aspose.pdf as ap

input_file = DIR_INPUT_TABLE + "Table_input.pdf"
output_file = DIR_OUTPUT + "Table_out.pdf"
# Load existing PDF document
pdf_document = ap.Document(input_file)
# Create TableAbsorber object to find tables
absorber = ap.text.TableAbsorber()
# Visit first page with absorber
absorber.visit(pdf_document.pages[1])
# Get first table on the page
table = absorber.table_list[0]
# Remove the table
absorber.remove(table)
# Save PDF
pdf_document.save(output_file)