Extraiga datos de formularios PDF a través de Python
Extraiga los campos de datos de usuario de un documento PDF rellenable. Utilice Aspose.PDF para que Python for .NET modifique archivos PDF mediante programación
Cómo extraer datos de formularios PDF con la biblioteca Python for .NET
Para extraer datos de formularios PDF (Acroforms) de un archivo PDF, utilizaremos la API Aspose.PDF for .NET, que es una API de manipulación de documentos rica en funciones, potente y fácil de usar para la plataforma python-net. Puede descargar su última versión directamente desde el administrador de paquetes NuGet, buscar Aspose.pdf e instalarla. También puede utilizar el siguiente comando desde la consola del administrador de paquetes.
Cómo extraer AcroForm en PDF usando Python
Necesita Aspose.PDF para .NET para probar el código en su entorno.
- Cargue el PDF en una instancia de la clase Document.
- Obtener valores de todos los campos usando la clase
Document.Form
. - Analice los nombres y los valores si es necesario.
- Cargar PDF en una instancia de la clase Document
- Obtener valores de todos los campos usando la clase
Document.Form