Python 를 통해 PDF 양식에서 데이터 추출

채울 수 있는 PDF 문서에서 사용자 데이터 필드를 추출합니다.Python for .NET 용 Aspose.PDF 파일을 사용하여 프로그래밍 방식으로 PDF 파일을 수정하십시오.

Python 라이브러리를 사용하여 PDF 양식에서 데이터를 추출하는 방법

PDF 양식 (아크로폼) 을 PDF 파일로 추출하기 위해 Aspose.PDF for Python.NET API를 사용하겠습니다. 이 API는 기능이 풍부하고 강력하며 사용하기 쉬운 파이썬 앱용 문서 조작 API입니다.PyPI 패키지 관리자에서 직접 최신 버전을 다운로드하고 aspose-pdf를 검색하여 설치할 수 있습니다.콘솔 또는 터미널에서 다음 명령을 사용할 수도 있습니다.

Python 를 사용하여 PDF에서 아크로폼을 추출하는 방법


사용자 환경에서 코드를 테스트하려면 Aspose.PDF for .NET 이 필요합니다.

1.문서 클래스의 인스턴스에서 PDF를 로드합니다. 1.Document.Form 클래스를 사용하여 모든 필드에서 값을 가져옵니다. 1.필요한 경우 이름과 값을 분석합니다. 1.문서 클래스의 인스턴스에서 PDF 불러오기 1.‘Document.Form’ 클래스를 사용하여 모든 필드에서 값 가져오기

PDF 양식에서 데이터 추출 - Python

이 샘플 코드는 Python 를 사용하여 PDF의 PDF 양식에서 데이터를 추출하는 방법을 보여줍니다.

import aspose.pdf as apdf

from os import path

path_infile = path.join(self.data_dir, infile)
form = apdf.facades.Form(path_infile)

form_values = {}

for formField in form.field_names:
    form_values[formField] = form.get_field(formField)

print(form_values)