แยกตารางจากเอกสาร PDF ผ่าน C++

วิธีการดึงตารางจาก PDF โดยใช้ C++ ห้องสมุด

วิธีการแยกตารางจากเอกสาร PDF โดยใช้ C++ ห้องสมุด

เพื่อที่จะดึงตารางจาก PDF เราจะใช้ Aspose.PDF for C++ API ซึ่งเป็นคุณลักษณะที่อุดมไปด้วยที่มีประสิทธิภาพและง่ายต่อการใช้ API การจัดการเอกสาร cpp แพลตฟอร์มเปิดตัวจัดการแพคเกจ NuGet ค้นหาaspose.pdf และติดตั้งนอกจากนี้คุณยังอาจใช้คำสั่งต่อไปนี้จากคอนโซลการจัดการแพคเกจ

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

แยกตารางจาก PDF ผ่าน C++


คุณจำเป็นต้อง Aspose.PDF for C++ เพื่อลองรหัสในสภาพแวดล้อมของคุณ

1.โหลดไฟล์ PDF ที่มีอินสแตนซ์ของเอกสาร 1.สร้างวัตถุ TableAbsorber เพื่อหาตาราง 1.เยี่ยมชมหน้าแรกที่มีโช้ค 1.รับตารางแรกบนหน้าเว็บ 1.เอาตารางออกบันทึกแฟ้ม

สารสกัดจากตารางไฟล์ PDF - C++


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }