Extraia dados de formulários PDF via Python
Extraia campos de dados do usuário de um documento PDF preenchível. Use o Aspose.PDF para Python for .NET para modificar arquivos PDF de forma programática
Como extrair dados de formulários PDF usando a biblioteca Python for .NET
Para extrair dados de formulários PDF (Acroforms) em um arquivo PDF, usaremos a API Aspose.PDF for .NET, que é uma API de manipulação de documentos rica em recursos, poderosa e fácil de usar para a plataforma python-net. Você pode baixar sua versão mais recente diretamente do gerenciador de pacotes NuGet, pesquisar Aspose.pdf e instalar. Você também pode usar o comando a seguir no console do Gerenciador de Pacotes.
Como extrair o AcroForm em PDF usando Python
Você precisa do Aspose.PDF for .NET para testar o código em seu ambiente.
- Carregue PDF em uma instância da classe Document.
- Obtenha valores de todos os campos usando a classe
Document.Form
. - Analise nomes e valores, se necessário.
- Carregar PDF em uma instância da classe Document
- Obter valores de todos os campos usando a classe
Document.Form