Extraiga datos de formularios PDF a través de Python

Extraiga los campos de datos de usuario de un documento PDF rellenable. Utilice Aspose.PDF para que Python for .NET modifique archivos PDF mediante programación

Cómo extraer datos de formularios PDF con la biblioteca Python for .NET

Para extraer datos de formularios PDF (Acroforms) de un archivo PDF, utilizaremos la API Aspose.PDF for .NET, que es una API de manipulación de documentos rica en funciones, potente y fácil de usar para la plataforma python-net. Puede descargar su última versión directamente desde el administrador de paquetes NuGet, buscar Aspose.pdf e instalarla. También puede utilizar el siguiente comando desde la consola del administrador de paquetes.

Cómo extraer AcroForm en PDF usando Python


Necesita Aspose.PDF para .NET para probar el código en su entorno.

  1. Cargue el PDF en una instancia de la clase Document.
  2. Obtener valores de todos los campos usando la clase Document.Form.
  3. Analice los nombres y los valores si es necesario.
  4. Cargar PDF en una instancia de la clase Document
  5. Obtener valores de todos los campos usando la clase Document.Form

Extraer datos de formularios PDF - Python

Este código de ejemplo muestra cómo extraer datos de formularios PDF en PDF utilizando Python

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")