جستجوی فایل های پی دی اف در Python

جستجوی اسناد پی دی اف بومی و با کارایی بالا با استفاده از Aspose.PDF سمت سرور برای API های Python بدون استفاده از نرم افزار هایی مانند Microsoft یا Adobe PDF.

نحوه جستجوی فایل PDF با استفاده از Python

برای جستجوی فایل پی دی اف، از API Aspose.PDF for Python استفاده خواهیم کرد که یک API قدرتمند، قدرتمند و آسان برای استفاده برای پلتفرم python-net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Python Package Manager Console

pip install aspose-pdf

جستجوی فایل پی دی اف از طریق Python


شما نیاز به Aspose.PDF for Python دارید تا کد را در محیط خود امتحان کنید.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. ایجاد تکست Fragmentabsorber شی با متن برای پیدا کردن به عنوان پارامتر. ۱. تمام مجموعه قطعات متن استخراج شده را دریافت کنید. ۱. حلقه را از طریق هر قطعه برای به دست آوردن تمام اطلاعات خود را.

جستجوی فایل های پی دی اف - Python


//Search Text from All the Pages of PDF Document
Document pdfDocument = new Document("SearchAndGetTextFromAll.pdf");

// Create TextAbsorber object to find all instances of the input search phrase
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber("text");

// Accept the absorber for all the pages
pdfDocument.Pages.Accept(textFragmentAbsorber);

// Get the extracted text fragments
TextFragmentCollection textFragmentCollection = textFragmentAbsorber.TextFragments;

// Loop through the fragments
foreach (TextFragment textFragment in textFragmentCollection)
{

    Console.WriteLine("Text : {0} ", textFragment.Text);
    Console.WriteLine("Position : {0} ", textFragment.Position);
    Console.WriteLine("XIndent : {0} ", textFragment.Position.XIndent);
    Console.WriteLine("YIndent : {0} ", textFragment.Position.YIndent);
    Console.WriteLine("Font - Name : {0}", textFragment.TextState.Font.FontName);
    Console.WriteLine("Font - IsAccessible : {0} ", textFragment.TextState.Font.IsAccessible);
    Console.WriteLine("Font - IsEmbedded : {0} ", textFragment.TextState.Font.IsEmbedded);
    Console.WriteLine("Font - IsSubset : {0} ", textFragment.TextState.Font.IsSubset);
    Console.WriteLine("Font Size : {0} ", textFragment.TextState.FontSize);
    Console.WriteLine("Foreground Color : {0} ", textFragment.TextState.ForegroundColor);
}