Ekstrak Tabel dari PDF melalui C++

Ekstrak tabel dari dokumen PDF. Gunakan Aspose.PDF untuk C++ untuk memodifikasi file PDF secara terprogram

Cara mengekstrak Tabel dari dokumen PDF Menggunakan C++ Library

Untuk mengekstrak tabel dari PDF, kita akan menggunakan Aspose.PDF untuk C++ API yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk platform cpp. Buka manajer paket nuget, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

Ekstrak Tabel dari PDF melalui C++


Anda perlu Aspose.PDF untuk C++ untuk mencoba kode di lingkungan Anda.

  1. Impor Perpustakaan yang Diperlukan
  2. Muat Dokumen PDF
  3. Inisialisasi TableAbsorber dan ulangi halaman
  4. Ekstrak konten tabel
  5. Simpan data yang diekstraksi (opsional)

Ekstrak Tabel dari PDF - C++


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }