Extraer tablas de un PDF a través de Python
Extraer la tabla del documento PDF. Utilice Aspose.PDF para que Python for .NET modifique los archivos PDF mediante programación
Cómo extraer tablas de un documento PDF con la biblioteca Python for .NET
Para extraer la tabla, usaremos la API Aspose.PDF for .NET, que es una API de manipulación de documentos rica en funciones, potente y fácil de usar para la plataforma python-net. Abra el administrador de paquetes NuGet, busque Aspose.pdf e instálelo. También puede usar el siguiente comando desde la consola de Package Manager.
Extraer tablas del PDF mediante Python
Necesita Aspose.PDF for .NET para probar el código en su entorno.
- Cargue el PDF con una instancia de Document.
- Crea el objeto TableAbsorber para buscar tablas.
- Visita la primera página con absorbedor.
- Consigue la primera mesa de la página.
- Quita la mesa. Guarde el archivo.