جستجوی PDF از طریق Python

جستجوی پیشرفته سند PDF برای تغییر اسناد PDF به صورت برنامه نویسی از Aspose.PDF برای Python for .NET استفاده کنید

نحوه جستجوی فایل PDF با استفاده از Python

برای جستجوی یک فایل PDF، از طریق Aspose.PDF برای Python استفاده خواهیم کرد.NET, یک API قدرتمند و آسان برای استفاده. باز کردن PyPI, آن را نصب کنید و برای جستجوی aspose-pdf جستجو کنید. از طرف دیگر، دستور را اجرا کنید:

Console

pip install aspose-pdf

جستجوی فایل پی دی اف از طریق Python


شما نیاز به Aspose.PDF for Python دارید تا کد را در محیط خود امتحان کنید.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. ایجاد تکست Fragmentabsorber شی با متن برای پیدا کردن به عنوان پارامتر. ۱. تمام مجموعه قطعات متن استخراج شده را دریافت کنید. ۱. حلقه را از طریق هر قطعه برای به دست آوردن تمام اطلاعات خود را.

جستجوی فایل های پی دی اف - Python

import aspose.pdf as apdf

from os import path
path_infile = path.join(self.data_dir, infile)

document = apdf.Document(path_infile)

# Create TextAbsorber object to find all instances of the input search phrase
textFragmentAbsorber = apdf.text.TextFragmentAbsorber("PDF")

# Accept the absorber for all the pages
document.pages.accept(textFragmentAbsorber)

# Loop through the fragments
for textFragment in textFragmentAbsorber.text_fragments:
    print(f"Text : {textFragment.text}" )
    print(f"Position : {textFragment.position}")
    print(f"XIndent : {textFragment.position.x_indent}")
    print(f"YIndent : {textFragment.position.y_indent}")
    print(f"Font - Name : {textFragment.text_state.font.font_name}" )
    print(f"Font - IsAccessible : {textFragment.text_state.font.is_accessible} " )
    print(f"Font - IsEmbedded : {textFragment.text_state.font.is_embedded} " )
    print(f"Font - IsSubset : {textFragment.text_state.font.is_subset} ")
    print(f"Font Size : {textFragment.text_state.font_size}" )
    print(f"Foreground Color : {textFragment.text_state.foreground_color} " )