Python를 사용하여 PDF 검색

고급 PDF 문서 검색Python for .NET 용 Aspose.PDF 파일을 사용하여 프로그래밍 방식으로 PDF 문서를 수정하십시오.

Python 를 사용하여 PDF 파일을 검색하는 방법

PDF 파일을 검색하려면 강력하고 사용하기 쉬운 API인 Aspose.PDF for Python via .NET를 사용합니다. PyPI를 열고 설치한 후 aspose-pdf를 검색하세요. 또는 다음 명령을 실행하세요.

Console

pip install aspose-pdf

Python 를 통해 PDF 파일 검색


사용자 환경에서 코드를 테스트하려면 Aspose.PDF for .NET 이 필요합니다.

  1. 문서 인스턴스와 함께 PDF를 로드합니다.
  2. 매개 변수로 찾을 텍스트를 사용하여 TextFragmentAbsorber 객체를 만듭니다.
  3. 추출된 모든 텍스트 조각 컬렉션을 가져옵니다.
  4. 각 프래그먼트를 반복해서 모든 정보를 얻으세요.

PDF 파일 검색 - Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)

document = apdf.Document(path_infile)

# Create TextAbsorber object to find all instances of the input search phrase
textFragmentAbsorber = apdf.text.TextFragmentAbsorber("PDF")

# Accept the absorber for all the pages
document.pages.accept(textFragmentAbsorber)

# Loop through the fragments
for textFragment in textFragmentAbsorber.text_fragments:
    print(f"Text : {textFragment.text}" )
    print(f"Position : {textFragment.position}")
    print(f"XIndent : {textFragment.position.x_indent}")
    print(f"YIndent : {textFragment.position.y_indent}")
    print(f"Font - Name : {textFragment.text_state.font.font_name}" )
    print(f"Font - IsAccessible : {textFragment.text_state.font.is_accessible} " )
    print(f"Font - IsEmbedded : {textFragment.text_state.font.is_embedded} " )
    print(f"Font - IsSubset : {textFragment.text_state.font.is_subset} ")
    print(f"Font Size : {textFragment.text_state.font_size}" )
    print(f"Foreground Color : {textFragment.text_state.foreground_color} " )