Extraia dados de formulários PDF via Python

Extraia campos de dados do usuário de um documento PDF preenchível. Use o Aspose.PDF para Python for .NET para modificar arquivos PDF de forma programática

Como extrair dados de formulários PDF usando a biblioteca Python for .NET

Para extrair dados de formulários PDF (Acroforms) em um arquivo PDF, usaremos a API Aspose.PDF for .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma python-net. Você pode baixar sua versão mais recente diretamente do gerenciador de pacotes NuGet, pesquisar Aspose.pdf e instalar. Você também pode usar o comando a seguir no console do Gerenciador de Pacotes.

Como extrair o AcroForm em PDF usando Python


Você precisa do Aspose.PDF for .NET para testar o código em seu ambiente.

  1. Carregue PDF em uma instância da classe Document.
  2. Obtenha valores de todos os campos usando a classe Document.Form.
  3. Analise nomes e valores, se necessário.
  4. Carregar PDF em uma instância da classe Document
  5. Obter valores de todos os campos usando a classe Document.Form

Extraia dados de formulários PDF - Python

Este código de exemplo mostra como extrair dados de formulários PDF em PDF usando Python

# Open document
pdf_document = Document(data_dir + "GetValuesFromAllFields.pdf")

# Get values from all fields
for form_field in pdf_document.form:
    # Analyze names and values if needed
    print(f"Field Name : {form_field.partial_name}")
    print(f"Value : {form_field.value}")