استخراج متن از PDF در PHP

نحوه استخراج متن از PDF با استفاده از PHP via Java

نحوه استخراج متن از PDF با استفاده از Aspose.PDF برای PHP via Java

به منظور استخراج متن فایل PDF، ما از Aspose.PDF for .NET API استفاده خواهیم کرد که یک API دستکاری سند غنی، قدرتمند و آسان برای استفاده برای پلت فرم php-java است. مدیر بسته NuGet را باز کنید، Aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

استخراج متن از PDF در PHP


شما نیاز به Aspose.PDF library دارید تا کد را در محیط خود امتحان کنید.

۱. PDF را با یک نمونه از سند بارگذاری کنید. ۱. برای استخراج متن، شیء TextObsorber را ایجاد کنید. ۱. جذب کننده را برای تمام صفحات بپذیرید. ۱. متن استخراج شده را دریافت کنید ۱. یک نویسنده ایجاد کنید و فایل را باز کنید، یک خط متن را به فایل بنویسید

استخراج متن از PDF با PHP

این کد نمونه نحوه استخراج متن از اسناد PDF را نشان می دهد

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

درباره Aspose.PDF for PHP via Java API

کتابخانه.NET ما می تواند یک سند از هر فرمت دانلود پشتیبانی شده را به هر فرمت ذخیره پشتیبانی شده ترکیب کند. Aspose.PDF برای کتابخانه.NET راه حل های نسبتاً جهانی ارائه می دهد که به شما کمک می کند وظایف ادغام اسناد را حل کنید. Aspose.PDF از تعداد قابل توجه ترین فرمت های سند محبوب، هم برای بارگذاری و هم برای ذخیره پشتیبانی می کند. توجه خود را به این واقعیت جلب کنید که بخش فعلی فقط ادغام های محبوب را توصیف می کند. صفحه فعلی اطلاعاتی در مورد ادغام TEXT به {{FILERESULT}} ارائه می دهد. با این حال، ترکیبات زیادی برای ادغام فایل های شما وجود دارد. برای لیست کامل فرمت های پشتیبانی شده، به بخش [فرمت های فایل پشتیبانی شده] مراجعه کنید (https://docs.aspose.com/pdf/net/supported-file-formats/).