Rimuovi tabelle dal PDF tramite Python

Elimina le tabelle dal documento PDF utilizzando Aspose.PDF per la libreria Python for .NET

Come eliminare le tabelle dal documento PDF utilizzando la libreria Python

Per eliminare una tabella, utilizza Aspose.PDF for Python via .NET, un’API potente e facile da usare. Apri PyPI, cerca aspose-pdf e installalo. In alternativa, esegui il comando:

Console

pip install aspose-pdf

Elimina tabelle dal PDF tramite Python

È necessario Aspose.PDF for .NET per provare il codice nel proprio ambiente.

Carica il PDF con un’istanza di Document.
Creare l’oggetto TableAbsorber per trovare le tabelle.
Visita la prima pagina con assorbitore.
Ottieni la prima tabella sulla pagina.
Rimuovi la tabella. Salvate il file.

Elimina tabelle dal PDF - Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
absorber = apdf.text.TableAbsorber()
absorber.visit(document.pages[1])
table = absorber.table_list[0]
absorber.remove(table)
document.save(path_outfile)