Extrahieren Sie Tabellen aus PDF über C++

Extrahieren Sie die Tabelle aus dem PDF-Dokument. Verwenden Sie Aspose.PDF for C++, um PDF-Dateien programmgesteuert zu ändern

So extrahieren Sie mithilfe der C++ Bibliothek Tabellen aus einem PDF-Dokument

Um eine Tabelle aus PDF zu extrahieren, verwenden wir die API Aspose.PDF for C++, eine funktionsreiche, leistungsstarke und einfach zu verwendende API zur Dokumentenbearbeitung für die cpp Plattform. Öffnen Sie den NuGet -Paketmanager, suchen Sie nach Aspose.pdf und installieren Sie es. Sie können auch den folgenden Befehl von der Package Manager Console aus verwenden.

Package Manager Console

PM > Install-Package Aspose.PDF.Cpp

Extrahiere Tabellen aus PDF via C++


Sie benötigen Aspose.PDF for C++, um den Code in Ihrer Umgebung auszuprobieren.

  1. Importieren Sie die erforderlichen Bibliotheken
  2. Laden Sie das PDF-Dokument
  3. Initialisiere den TableAbsorber und iteriere über Seiten
  4. Extrahieren Sie den Tabelleninhalt
  5. Extrahierte Daten speichern (optional)

Extrahiere Tabellen aus PDF - C++


auto document = MakeObject<Document>(_dataDir + u"the_worlds_cities_in_2018_data_booklet 7.pdf");
    for (auto page : document->get_Pages())
    {
        auto absorber = MakeObject<Aspose::Pdf::Text::TableAbsorber>();
        absorber->Visit(page);
        for (auto table : absorber->get_TableList())
        {
            for (auto row : table->get_RowList())
            {
                for (auto cell : row->get_CellList())
                {
                    auto textfragment = MakeObject<TextFragment>();
                    auto textFragmentCollection = cell->get_TextFragments();
                    for (auto fragment : textFragmentCollection)
                    {
                        String txt;
                        for (auto seg : fragment->get_Segments())
                        {
                            txt += seg->get_Text();
                        }
                        Console::WriteLine(txt);
                    }
                }
            }
        }
    }