Tabloları PDF belgesinden C# aracılığıyla ayıklayın

C# Kütüphane kullanarak PDF’den Tablo nasıl çıkarılır

PDF belgesinden Tablolar nasıl çıkarılır .NET Kitaplığı Kullanarak

Tabloyu çıkarmak için net platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan .NET için Aspose.PDF API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.PDF öğesini arayın ve yükleyin. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz.

Package Manager Console

PM > Install-Package Aspose.PDF

Tabloları PDF’den C# aracılığıyla çıkarın


Ortamınızdaki kodu denemek için Aspose.PDF for .NET gerekir.

  1. PDF’yi bir Belge örneğiyle yükleyin.
  2. Tabloları bulmak için TableAbsorber nesnesi oluşturun.
  3. Emici ile ilk sayfayı ziyaret edin.
  4. Sayfadaki ilk tabloyu alın.
  5. Tabloyu çıkarın. Dosyayı kaydedin.

PDF'den Tabloları Çıkarın - C#.


Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(@"c:\tmp\the_worlds_cities_in_2018_data_booklet 7.pdf");           
    foreach (var page in pdfDocument.Pages)
    {
        Aspose.Pdf.Text.TableAbsorber absorber = new Aspose.Pdf.Text.TableAbsorber();
        absorber.Visit(page);
        foreach (AbsorbedTable table in absorber.TableList)
        {
            foreach (AbsorbedRow row in table.RowList)
            {
                foreach (AbsorbedCell cell in row.CellList)
                {
                    TextFragment textfragment = new TextFragment();
                    TextFragmentCollection textFragmentCollection = cell.TextFragments;
                    foreach (TextFragment fragment in textFragmentCollection)
                    {
                        string txt = "";
                        foreach (TextSegment seg in fragment.Segments)
                        {
                            txt += seg.Text;
                        }
                        Console.WriteLine(txt);
                    }
                }
            }
        }
    }