Удалите таблицы из PDF с помощью Python

Удалите таблицы из PDF-документа с помощью Aspose.PDF для библиотеки Python for .NET

Как удалить таблицы из PDF-документа с помощью библиотеки Python for .NET

Чтобы удалить таблицу, используйте Aspose.PDF for Python via .NET, мощный и простой в использовании API. Откройте PyPI, найдите aspose-pdf и установите его. Или выполните команду:

Console

pip install aspose-pdf

Удалить таблицы из PDF через Python


Вам нужно Aspose.PDF for .NET попробовать код в своей среде.

  1. Загрузите PDF-файл с экземпляром документа.
  2. Создайте объект TableAbsorber для поиска таблиц.
  3. Посетите первую страницу с абсорбером.
  4. Получите первый стол на странице.
  5. Уберите таблицу. Сохраните файл.

Удалить таблицы из PDF - Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)
path_outfile = path.join(self.data_dir, outfile)

document = apdf.Document(path_infile)
absorber = apdf.text.TableAbsorber()
absorber.visit(document.pages[1])
table = absorber.table_list[0]
absorber.remove(table)
document.save(path_outfile)