استخراج جداول از PDF از طریق C++

جدول را از سند PDF استخراج کنید. از Aspose.PDF برای C++ برای اصلاح فایل های PDF به صورت برنامه نویسی استفاده کنید

نحوه استخراج جداول از سند PDF با استفاده از کتابخانه C++

به منظور استخراج جدول از PDF، از API Aspose.PDF برای C++ استفاده خواهیم کرد که یک API دستکاری اسناد غنی، قدرتمند و آسان برای استفاده برای پلتفرم cpp است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

قابلیت استخراج جداول از پی دی اف از طریق C++


شما نیاز به Aspose.PDF برای C++ به سعی کنید کد در محیط شما.

۱. وارد کردن کتابخانه های لازم ۱. سند PDF را بارگذاری کنید ۱. TableAbsorber را اولیه کنید و روی صفحات تکرار کنید ۱. استخراج محتوای جدول ۱. ذخیره داده های استخراج شده (اختیاری)

قابلیت استخراج جداول از پی دی اف - C++


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }