استخراج PDF از طریق PHP

نحوه استخراج متن و تصاویر از PDF با استفاده از کتابخانه PHP via Java

محبوب ترین اقدام با پارسر

نحوه تجزیه PDF با کتابخانه PHP via Java

برای استخراج فایل های PDF، از API Aspose.PDF for .NET استفاده خواهیم کرد، که یک API دستکاری اسناد غنی از ویژگی، قدرتمند و آسان برای پلت فرم php-java است. مدیر بسته NuGet را باز کنید، Aspose.PDF را جستجو کنید و نصب کنید. همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

تجزیه PDF از طریق PHP


شما نیاز به کتابخانه Aspose.PDF به سعی کنید کد در محیط شما.

۱. PDF را با یک نمونه از سند بارگذاری کنید. ۱. یک شیء TextAbsorber برای استخراج متن ایجاد کنید. ۱. جذب کننده را برای همه صفحات بپذیرید. ۱. متن استخراج شده را دریافت کنید ۱. یک نویسنده ایجاد کنید و فایل را باز کنید، یک خط متن را به فایل بنویسید

استخراج فایلهای PDF - PHP

این کد نمونه نحوه استخراج اسناد PDF را نشان می دهد

Input file:

File not added

Output format:

PDF

Output file:


    // Create a new Document object from the input PDF file.
    $document = new Document($inputFile);

    // Create a new TextAbsorber object to extract text from the document.
    $textAbsorber = new TextAbsorber();

    // Extract text from the document.
    $textAbsorber->visit($document);

    // Get the extracted text content.
    $content = $textAbsorber->getText();

    // Save the extracted text to the output file.
    file_put_contents($outputFile, $content);

    $document->close();

درباره Aspose.PDF for PHP via Java API

ما.NET Library می تواند یک سند را از هر فرمت دانلود پشتیبانی شده به هر فرمت ذخیره پشتیبانی شده ترکیب کند. Aspose.PDF برای.NET library راه حل های نسبتا جهانی را فراهم می کند که به شما در حل وظایف ادغام اسناد کمک می کند. Aspose.PDF از تعداد قابل توجهی از فرمت های سند محبوب، هر دو برای بارگیری و صرفه جویی پشتیبانی می کند. توجه خود را به این واقعیت جلب کنید که بخش فعلی فقط ادغام های محبوب را توصیف می کند. صفحه فعلی اطلاعاتی در مورد ادغام {{FILETYPE}} به {{FILERESULT}} ارائه می دهد. با این حال، ترکیبات زیادی برای ادغام فایل های شما وجود دارد. برای یک لیست کامل از فرمت های پشتیبانی شده، بخش Formats File پشتیبانی شده. را ببینید