Extraia tabelas do PDF via Python
Extraia a tabela do documento PDF. Use o Aspose.PDF para Python for .NET para modificar arquivos PDF de forma programática
Como extrair tabelas de um documento PDF usando a biblioteca Python for .NET
Para extrair a tabela, usaremos a API Aspose.PDF for .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma python-net. Abra o gerenciador de pacotes NuGet, procure por Aspose.pdf e instale. Você também pode usar o seguinte comando no Console do Gerenciador de Pacotes.
Extraia tabelas do PDF via Python
Você precisa Aspose.PDF for .NET testar o código em seu ambiente.
- Carregue o PDF com uma instância de Document.
- Crie o objeto TableAbsorber para encontrar tabelas.
- Visite a primeira página com absorvedor.
- Obtenha a primeira tabela na página.
- Retire a mesa. Salve o arquivo.