برای جستجوی یک فایل PDF، از طریق Aspose.PDF برای Python استفاده خواهیم کرد.NET, یک API قدرتمند و آسان برای استفاده. باز کردن PyPI, آن را نصب کنید و برای جستجوی aspose-pdf جستجو کنید. از طرف دیگر، دستور را اجرا کنید:
جستجوی فایل پی دی اف از طریق Python
شما نیاز به Aspose.PDF for Python دارید تا کد را در محیط خود امتحان کنید.
۱. PDF را با نمونه ای از سند بارگذاری کنید.
۱. ایجاد تکست Fragmentabsorber شی با متن برای پیدا کردن به عنوان پارامتر.
۱. تمام مجموعه قطعات متن استخراج شده را دریافت کنید.
۱. حلقه را از طریق هر قطعه برای به دست آوردن تمام اطلاعات خود را.
جستجوی فایل های پی دی اف - Python
import aspose.pdf as apdf
from os import path
path_infile = path.join(self.data_dir, infile)
document = apdf.Document(path_infile)
# Create TextAbsorber object to find all instances of the input search phrase
textFragmentAbsorber = apdf.text.TextFragmentAbsorber("PDF")
# Accept the absorber for all the pages
document.pages.accept(textFragmentAbsorber)
# Loop through the fragments
for textFragment in textFragmentAbsorber.text_fragments:
print(f"Text : {textFragment.text}" )
print(f"Position : {textFragment.position}")
print(f"XIndent : {textFragment.position.x_indent}")
print(f"YIndent : {textFragment.position.y_indent}")
print(f"Font - Name : {textFragment.text_state.font.font_name}" )
print(f"Font - IsAccessible : {textFragment.text_state.font.is_accessible} " )
print(f"Font - IsEmbedded : {textFragment.text_state.font.is_embedded} " )
print(f"Font - IsSubset : {textFragment.text_state.font.is_subset} ")
print(f"Font Size : {textFragment.text_state.font_size}" )
print(f"Foreground Color : {textFragment.text_state.foreground_color} " )