استخراج متن از PDF در PHP

نحوه استخراج متن از PDF با استفاده از php-java

نحوه استخراج متن از PDF با استفاده از Aspose.PDF برای PHP via Java

به منظور استخراج متن فایل PDF، ما از Aspose.PDF for .NET API استفاده خواهیم کرد که یک API دستکاری سند غنی، قدرتمند و آسان برای استفاده برای پلت فرم php-java است. مدیر بسته NuGet را باز کنید، Aspose.PDF را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

استخراج متن از PDF در PHP


شما نیاز به Aspose.PDF library دارید تا کد را در محیط خود امتحان کنید.

۱. PDF را با یک نمونه از سند بارگذاری کنید. ۱. برای استخراج متن، شیء TextObsorber را ایجاد کنید. ۱. جذب کننده را برای تمام صفحات بپذیرید. ۱. متن استخراج شده را دریافت کنید ۱. یک نویسنده ایجاد کنید و فایل را باز کنید، یک خط متن را به فایل بنویسید

استخراج متن از PDF با PHP

این کد نمونه نحوه استخراج متن از اسناد PDF را نشان می دهد

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

درباره Aspose.PDF for PHP via Java API

ما.NET Library می تواند یک سند را از هر فرمت دانلود پشتیبانی شده به هر فرمت ذخیره پشتیبانی شده ترکیب کند. Aspose.PDF برای.NET library راه حل های نسبتا جهانی را فراهم می کند که به شما در حل وظایف ادغام اسناد کمک می کند. Aspose.PDF از تعداد قابل توجهی از فرمت های سند محبوب، هر دو برای بارگیری و صرفه جویی پشتیبانی می کند. توجه خود را به این واقعیت جلب کنید که بخش فعلی فقط ادغام های محبوب را توصیف می کند. صفحه فعلی اطلاعاتی در مورد ادغام TEXT به {{FILERESULT}} ارائه می دهد. با این حال، ترکیبات زیادی برای ادغام فایل های شما وجود دارد. برای یک لیست کامل از فرمت های پشتیبانی شده، بخش Formats File پشتیبانی شده. را ببینید