C++ 를 통해 PDF 문서에서 테이블을 추출합니다.

C++ 라이브러리를 사용하여 PDF에서 테이블을 추출하는 방법

C++ 라이브러리를 사용하여 PDF 문서에서 테이블을 추출하는 방법

PDF에서 테이블을 추출하기 위해 cpp 플랫폼을 위한 기능이 풍부하고 강력하며 사용하기 쉬운 문서 조작 API인 Aspose.PDF for C++ API를 사용할 것입니다.NuGet 패키지 관리자를 열고 Aspose.pdf를 검색하여 설치합니다.패키지 관리자 콘솔에서 다음 명령을 사용할 수도 있습니다.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

C++ 를 통해 PDF에서 표 추출


사용자 환경에서 코드를 테스트하려면 Aspose.PDF for C++ 가 필요합니다.

1.문서 인스턴스와 함께 PDF를 로드합니다. 1.테이블을 찾기 위해 TableAbsorber 객체를 생성합니다. 1.업소버와 함께 첫 페이지를 방문하세요. 1.페이지의 첫 번째 테이블을 가져옵니다. 1.테이블을 제거합니다.파일을 저장합니다.

PDF에서 표 추출하기 - C++


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }