قابلیت استخراج جداول از سند پی دی اف از طریق C++

نحوه استخراج جدول از PDF با استفاده از C++ کتابخانه

نحوه استخراج جداول از سند PDF با استفاده از کتابخانه C++

به منظور استخراج جدول از PDF، از API Aspose.PDF برای C++ استفاده خواهیم کرد که یک API دستکاری اسناد غنی، قدرتمند و آسان برای استفاده برای پلتفرم cpp است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

قابلیت استخراج جداول از پی دی اف از طریق C++


شما نیاز به Aspose.PDF برای C++ به سعی کنید کد در محیط شما.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. ایجاد شیء TableAbsorber برای پیدا کردن جداول. ۱. بازدید از صفحه اول با جذب. ۱. اولین جدول را در صفحه دریافت کنید ۱. جدول را بردارید فایل را ذخیره کنید

قابلیت استخراج جداول از پی دی اف - C++


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }