برای جستجوی فایل پی دی اف، از API Aspose.PDF for Python استفاده خواهیم کرد که یک API قدرتمند، قدرتمند و آسان برای استفاده برای پلتفرم python-net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.
جستجوی فایل پی دی اف از طریق Python
شما نیاز به Aspose.PDF for Python دارید تا کد را در محیط خود امتحان کنید.
۱. PDF را با نمونه ای از سند بارگذاری کنید.
۱. ایجاد تکست Fragmentabsorber شی با متن برای پیدا کردن به عنوان پارامتر.
۱. تمام مجموعه قطعات متن استخراج شده را دریافت کنید.
۱. حلقه را از طریق هر قطعه برای به دست آوردن تمام اطلاعات خود را.
جستجوی فایل های پی دی اف - Python
import aspose.pdf as ap
# Search Text from All the Pages of PDF Document
pdfDocument = ap.Document("c:\\samples\\sample.pdf")
# Create TextAbsorber object to find all instances of the input search phrase
textFragmentAbsorber = ap.text.TextFragmentAbsorber("PDF")
# Accept the absorber for all the pages
pdfDocument.pages.accept(textFragmentAbsorber)
# Loop through the fragments
for textFragment in textFragmentAbsorber.text_fragments:
print(f"Text : {textFragment.text}" )
print(f"Position : {textFragment.position}")
print(f"XIndent : {textFragment.position.x_indent}")
print(f"YIndent : {textFragment.position.y_indent}")
print(f"Font - Name : {textFragment.text_state.font.font_name}" )
print(f"Font - IsAccessible : {textFragment.text_state.font.is_accessible} " )
print(f"Font - IsEmbedded : {textFragment.text_state.font.is_embedded} " )
print(f"Font - IsSubset : {textFragment.text_state.font.is_subset} ")
print(f"Font Size : {textFragment.text_state.font_size}" )
print(f"Foreground Color : {textFragment.text_state.foreground_color} " )