استخراج PDF در C++

نحوه استخراج متن و تصاویر از PDF با استفاده از کتابخانه C++

محبوب ترین اقدام با پارسر

نحوه استخراج PDF با کتابخانه C++

آیا شما نیاز به استخراج PDF دارید؟ اصلاح برنامه ای اسناد PDF بخش مهمی از گردش کار دیجیتال مدرن است. با کتابخانه های C++ مانند Aspose.PDF، توسعه دهندگان می توانند متن را از PDF استخراج کنند یا تصاویر را از PDF استخراج کنند. این کتابخانه ها راه حل های مستقلی هستند که به نرم افزارهای دیگر متکی نیستند و برای استفاده تجاری آماده هستند. آنها تمام نیازهای احتمالی توسعه دهندگان حرفه ای ++C را پوشش می دهند.

  • استخراج داده های PDF: متون، تصاویر، فرم ها، زمینه ها و غیره
  • استخراج متن از PDF
  • استخراج تصاویر از PDF
  • استخراج فونت از PDF
  • استخراج داده ها از فرم
  • استخراج متن از تمبرها
  • استخراج داده ها از جدول

به منظور استخراج فایل PDF، ما از Aspose.PDF for C++ API استفاده خواهیم کرد که یک API دستکاری سند غنی، قدرتمند و آسان برای استفاده از پلت فرم cpp است. مدیر بسته NuGet را باز کنید، Aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

تجزیه PDF از طریق C++


شما نیاز به Aspose.PDF برای C++ به سعی کنید کد در محیط شما.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. برای استخراج متن متن آبجکت Sorber ایجاد کنید. ۱. جذب برای تمام صفحات را بپذیرید. ۱. متن استخراج شده را دریافت کنید ۱. یک نویسنده ایجاد کنید و فایل را باز کنید، یک خط متن را به فایل بنویسید

استخراج فایلهای PDF - C++

این کد نمونه نحوه استخراج اسناد PDF را نشان می دهد

Input file:

File not added

Output format:

PDF

Output file:


    void ExtractTextFromAllThePages() {

    std::clog << __func__ << ": Start" << std::endl;
    // String for path name
    String _dataDir("C:\\Samples\\Parsing\\");

    // String for file name
    String infilename("sample-4pages.pdf");
    String outfilename("extracted-text.txt");

    // Open document
    auto document = MakeObject<Document>(_dataDir + infilename);

    // Create TextAbsorber object to extract text
    auto textAbsorber = MakeObject<TextAbsorber>();
    // Accept the absorber for all the pages
    document->get_Pages()->Accept(textAbsorber);
    // Get the extracted text
    auto extractedText = textAbsorber->get_Text();

    System::IO::File::WriteAllText(_dataDir + outfilename, extractedText);
    std::clog << __func__ << ": Finish" << std::endl;
}

درباره Aspose.PDF برای C++ API

Aspose.PDF for C++ یک کتابخانه پردازش قدرتمند است که توسعه دهندگان را قادر می سازد اسناد PDF را بدون استفاده از Adobe Acrobat ایجاد، خواندن و دستکاری کنند. این برنامه طیف گسترده ای از ویژگی های مانند ایجاد فرم ها، اضافه کردن/ویرایش متن، دستکاری صفحات PDF، اضافه کردن حاشیه نویسی، دست زدن به فونت های سفارشی و موارد دیگر را فراهم می کند.

Aspose.PDF for C++ کتابخانه ای است که توسعه دهندگان را قادر می سازد قابلیت های پردازش PDF را به برنامه های خود اضافه کنند. API می تواند برای ساخت هر نوع برنامه های 32 بیتی و 64 بیتی برای تولید یا خواندن، تبدیل و دستکاری فایل های PDF بدون استفاده از Adobe Acrobat استفاده شود.

شما می توانید توضیحات و مثال های دقیق برای هر کلاس و روش را در Aspose.PDF برای کتابخانه C++ در مرجع API پیدا کنید. و همچنین توصیه می شود برای مشاهده مستندات.