Ekstrak Tabel dari dokumen PDF melalui C++

Cara mengekstrak Tabel dari PDF menggunakan C++ Library

Cara mengekstrak Tabel dari dokumen PDF Menggunakan C++ Library

Untuk mengekstrak tabel dari PDF, kita akan menggunakan Aspose.PDF untuk C++ API yang merupakan API manipulasi dokumen yang kaya fitur, kuat, dan mudah digunakan untuk platform cpp. Buka manajer paket nuget, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

Ekstrak Tabel dari PDF melalui C++


Anda perlu Aspose.PDF untuk C++ untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dengan instance Document.
  2. Buat objek TableAbsorber untuk menemukan tabel.
  3. Kunjungi halaman pertama dengan absorber.
  4. Dapatkan tabel pertama pada halaman.
  5. Lepaskan tabel. Simpan file.

Ekstrak Tabel dari PDF - C++


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }