جستجوی PDF از طریق Python

جستجوی پیشرفته سند PDF برای تغییر اسناد PDF به صورت برنامه نویسی از Aspose.PDF برای Python for .NET استفاده کنید

نحوه جستجوی فایل PDF با استفاده از Python

برای جستجوی فایل پی دی اف، از API Aspose.PDF for Python استفاده خواهیم کرد که یک API قدرتمند، قدرتمند و آسان برای استفاده برای پلتفرم python-net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Python Package Manager Console

pip install aspose-pdf

جستجوی فایل پی دی اف از طریق Python


شما نیاز به Aspose.PDF for Python دارید تا کد را در محیط خود امتحان کنید.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. ایجاد تکست Fragmentabsorber شی با متن برای پیدا کردن به عنوان پارامتر. ۱. تمام مجموعه قطعات متن استخراج شده را دریافت کنید. ۱. حلقه را از طریق هر قطعه برای به دست آوردن تمام اطلاعات خود را.

جستجوی فایل های پی دی اف - Python

import aspose.pdf as ap

# Search Text from All the Pages of PDF Document
pdfDocument = ap.Document("c:\\samples\\sample.pdf")

# Create TextAbsorber object to find all instances of the input search phrase
textFragmentAbsorber = ap.text.TextFragmentAbsorber("PDF")

# Accept the absorber for all the pages
pdfDocument.pages.accept(textFragmentAbsorber)

# Loop through the fragments
for textFragment in textFragmentAbsorber.text_fragments:
    print(f"Text : {textFragment.text}" )
    print(f"Position : {textFragment.position}")
    print(f"XIndent : {textFragment.position.x_indent}")
    print(f"YIndent : {textFragment.position.y_indent}")
    print(f"Font - Name : {textFragment.text_state.font.font_name}" )
    print(f"Font - IsAccessible : {textFragment.text_state.font.is_accessible} " )
    print(f"Font - IsEmbedded : {textFragment.text_state.font.is_embedded} " )
    print(f"Font - IsSubset : {textFragment.text_state.font.is_subset} ")
    print(f"Font Size : {textFragment.text_state.font_size}" )
    print(f"Foreground Color : {textFragment.text_state.foreground_color} " )