Extraia dados de formulários PDF via Python

Extraia campos de dados do usuário de um documento PDF preenchível. Use o Aspose.PDF for Python for .NET para modificar arquivos PDF de forma programática

Como extrair dados de formulários PDF usando a biblioteca Python for .NET

Para extrair dados de formulários PDF (Acroforms) em um arquivo PDF, usaremos a API Aspose.PDF for .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma python-net. Você pode baixar sua versão mais recente diretamente do gerenciador de pacotes NuGet, pesquisar Aspose.pdf e instalar. Você também pode usar o comando a seguir no console do Gerenciador de Pacotes.

Como extrair o AcroForm em PDF usando Python


Você precisa do Aspose.PDF for .NET para testar o código em seu ambiente.

  1. Carregue PDF em uma instância da classe Document.
  2. Obtenha valores de todos os campos usando a classe Document.Form.
  3. Analise nomes e valores, se necessário.
  4. Carregar PDF em uma instância da classe Document
  5. Obter valores de todos os campos usando a classe Document.Form

Extraia dados de formulários PDF - Python

Este código de exemplo mostra como extrair dados de formulários PDF em PDF usando Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)