Tabloları PDF belgesinden C++ aracılığıyla ayıklayın

C++ Kütüphane kullanarak PDF’den Tablo nasıl çıkarılır

PDF belgesinden Tablolar nasıl çıkarılır C++ Kitaplığı Kullanarak

PDF’den tablo çıkarmak için cpp platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan C++ için Aspose.PDF API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.PDF öğesini arayın ve yükleyin. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

Tabloları PDF’den C++ aracılığıyla çıkarın


Ortamınızdaki kodu denemek için C++ için Aspose.PDF gerekir.

  1. PDF’yi bir Belge örneğiyle yükleyin.
  2. Tabloları bulmak için TableAbsorber nesnesi oluşturun.
  3. Emici ile ilk sayfayı ziyaret edin.
  4. Sayfadaki ilk tabloyu alın.
  5. Tabloyu çıkarın. Dosyayı kaydedin.

PDF'den Tabloları Çıkarın - C++.


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }