Eliminar tablas de un PDF a través de Python

Elimine tablas de un documento PDF con Aspose.PDF for la biblioteca Python for .NET

Cómo eliminar tablas de un documento PDF con la biblioteca Python for .NET

Para eliminar una tabla, use Aspose.PDF for Python via .NET, una API potente y fácil de usar. Abra PyPI, busque aspose-pdf e instálelo. También puede ejecutar el comando:

Console

pip install aspose-pdf

Eliminar tablas del PDF mediante Python


Necesita Aspose.PDF for .NET para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Crea el objeto TableAbsorber para buscar tablas.
  3. Visita la primera página con absorbedor.
  4. Consigue la primera mesa de la página.
  5. Quita la mesa. Guarde el archivo.

Eliminar tablas del PDF: Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
absorber = apdf.text.TableAbsorber()
absorber.visit(document.pages[1])
table = absorber.table_list[0]
absorber.remove(table)
document.save(path_outfile)