Estrai tabelle dal documento PDF tramite Python
Come estrarre la tabella dal PDF usando la libreria Python
Come estrarre tabelle dal documento PDF utilizzando la libreria Python for .NET
Per estrarre la tabella, useremo l’API Aspose.PDF for .NET che è un’API di manipolazione dei documenti ricca di funzionalità, potente e facile da usare per la piattaforma python-net. Apri il gestore pacchetti NuGet, cerca Aspose.pdf e installa. È inoltre possibile utilizzare il seguente comando dalla console di Gestione pacchetti.
Estrai tabelle da PDF tramite Python
È necessario Aspose.PDF for .NET per provare il codice nel proprio ambiente.
- Carica il PDF con un’istanza di Document.
- Creare l’oggetto TableAbsorber per trovare le tabelle.
- Visita la prima pagina con assorbitore.
- Ottieni la prima tabella sulla pagina.
- Rimuovi la tabella. Salvate il file.