Extraia dados de formulários PDF via Python

Extraia campos de dados do usuário de um documento PDF preenchível. Use o Aspose.PDF para Python for .NET para modificar arquivos PDF de forma programática

Como extrair dados de formulários PDF usando a biblioteca Python

Para extrair formulários PDF (Acroforms) em um arquivo PDF, usaremos a API Aspose.PDF para Python via .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para o aplicativo Python. Você pode baixar a versão mais recente diretamente do gerenciador de pacotes PyPI, pesquisar aspose-pdf e instalar. Você também pode usar o seguinte comando no console ou terminal.

Como extrair o AcroForm em PDF usando Python


Você precisa de Aspose.PDF for.NET para testar o código em seu ambiente.

  1. Carregue o PDF em uma instância da classe Document.
  2. Obtenha valores de todos os campos usando a classe Document.Form.
  3. Analise nomes e valores, se necessário.
  4. Carregar PDF em uma instância da classe Document
  5. Obtenha valores de todos os campos usando a classe Document.Form

Extraia dados de formulários PDF - Python

Este exemplo de código mostra como extrair dados de formulários PDF em PDF usando Python

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)