Python 를 통해 PDF 메타데이터를 추출하세요

PDF 문서에서 메타데이터를 추출합니다.Python for .NET 용 Aspose.PDF 파일을 사용하여 프로그래밍 방식으로 PDF 파일을 수정하십시오.

Python 라이브러리를 사용하여 PDF 메타데이터를 추출하는 방법

파이썬용 Aspose.PDF 를 사용하여 PDF에서 메타데이터를 추출합니다.문서의 메타데이터에 액세스한다는 것은 제목, 작성자, 작성 시기, 특정 키워드 등 해당 파일에 대한 정보를 가져오는 것을 의미합니다.메타데이터를 추출하면 대량의 PDF 컬렉션을 보다 효과적으로 구성할 수 있습니다.메타데이터에서 추출한 데이터는 파일 검색 방법을 개선합니다.사용자는 추출된 메타데이터에 있는 키워드 또는 세부 정보를 사용하여 특정 문서를 빠르게 찾을 수 있습니다.메타데이터를 추출하면 파일에 포함된 내용에 대한 귀중한 통찰력을 얻을 수 있습니다.파일에 대한 주요 세부 정보가 간략하게 요약되어 있어 문서를 열지 않고도 문서의 내용을 쉽게 이해할 수 있습니다.메타데이터를 추출하면 문서가 진짜인지 확인할 수 있습니다.문서 작성 시 작성자 이름, 수정 기록 등의 세부 정보를 확인할 수 있습니다.이 검증은 PDF의 신뢰성을 확인하는 데 매우 중요합니다.추출된 메타데이터는 PDF 내용에 대한 간결한 세부 정보를 제공하므로 사용자 경험이 훨씬 향상됩니다.이를 통해 사용자는 문서를 쉽게 식별하고 작업할 수 있습니다.전반적으로 PDF 메타데이터를 추출하면 문서 관리 효율성 향상, 검색 옵션 개선, 표준 준수, 전반적인 사용자 경험 향상 등 많은 이점이 있습니다.Aspose를 통해 PDF에서 메타데이터를 추출하고 데이터 작업에 필요한 모든 작업을 해결하세요.PDF 파일에서 메타데이터를 추출하기 위해 기능이 풍부하고 강력하며 사용하기 쉬운.NET용 문서 조작 API인 Aspose.PDF for .NET API를 사용할 것입니다.NuGet 패키지 관리자를 열고 ASpose.pdf를 검색한 다음 설치합니다.패키지 관리자 콘솔에서 다음 명령을 사용할 수도 있습니다.

Console

pip install aspose-pdf

Python 를 통해 PDF 메타데이터를 추출하세요

사용자 환경에서 코드를 사용해 보려면 .NET용 Aspose.PDF 가 필요합니다.

문서 인스턴스와 함께 PDF를 로드합니다.
Document.Info 속성을 사용하여 문서 정보를 가져옵니다.
다양한 Document.Info 속성에 액세스하여 표시할 수 있습니다.

제공된 Python 코드 스니펫은 Aspose.PDF 라이브러리에서 PDF에서 메타데이터를 추출하는 방법을 보여줍니다.그러면 변수 ‘DIR_INPUT_METADATA’로 지정된 디렉토리에 있는 ‘GetFileInfo.pdf ‘라는 이름의 PDF 파일이 열립니다.코드는 ‘info’ 함수를 사용하여 문서에서 다양한 세부 정보를 검색합니다.작성자 이름, 작성 날짜, 키워드, 수정 날짜, 주제 및 제목과 같은 PDF의 특정 메타데이터 정보를 표시합니다.코드에서는 ‘print’ 함수를 사용하여 이 정보를 표시합니다.이 코드 스니펫은 Aspose.PDF 라이브러리 또는 프레임워크를 사용하여 PDF 파일에서 메타데이터를 추출하는 방법을 보여주는 간단한 예제입니다.

PDF의 메타데이터를 추출하세요 - Python

이 샘플 코드는 PDF 파일의 메타데이터 정보를 추출하는 방법을 보여줍니다.

Input file:

Upload a file

File not added

Output format:

Output file:

import aspose.pdf as apdf

from os import path

input_file = path.join(self.data_dir, infile)
# Open document
document = apdf.Document(input_file)

# Get document information
doc_info = document.info
# Show document information
print("Author :", doc_info.author)
print("Creation Date :", doc_info.creation_date)
print("Keywords :", doc_info.keywords)
print("Modify Date :", doc_info.mod_date)
print("Subject :", doc_info.subject)
print("Title :", doc_info.title)