C# aracılığıyla PDF’den Tabloları Çıkarın

PDF belgesinden tabloyu ayıklayın. PDF dosyalarını programlı olarak değiştirmek için .NET için Aspose.PDF dosyasını kullanın

PDF belgesinden Tablolar nasıl çıkarılır .NET Kitaplığı Kullanarak

Tabloyu çıkarmak için net platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir belge işleme API’si olan .NET için Aspose.PDF API’sini kullanacağız. NuGet paket yöneticisini açın, Aspose.PDF öğesini arayın ve yükleyin. Paket Yöneticisi Konsolu’ndan aşağıdaki komutu da kullanabilirsiniz.

Package Manager Console

PM > Install-Package Aspose.PDF

Tabloları PDF’den C# aracılığıyla çıkarın


Ortamınızdaki kodu denemek için Aspose.PDF for .NET gerekir.

  1. Gerekli Kütüphaneleri İçe Aktar
  2. PDF Belgesini Yükle
  3. TableAbsorber öğesini başlatın ve sayfalar üzerinde yineleyin
  4. Tablo içeriğini ayıklayın
  5. Çıkarılan verileri kaydet (isteğe bağlı)

PDF'den Tabloları Çıkarın - C#

var pdfDocument = new Aspose.Pdf.Document("sample.pdf");
foreach (var page in pdfDocument.Pages)
{
    var absorber = new Aspose.Pdf.Text.TableAbsorber();
    absorber.Visit(page);
    foreach (var table in absorber.TableList)
    {
        foreach (var row in table.RowList)
        {
            foreach (var cell in row.CellList)
            {
                var textfragment = new Aspose.Pdf.Text.TextFragment();
                var textFragmentCollection = cell.TextFragments;
                foreach (var fragment in textFragmentCollection)
                {
                    string txt = "";
                    foreach (var seg in fragment.Segments)
                    {
                        txt += seg.Text;
                    }
                    Console.WriteLine(txt);
                }
            }
        }
    }
}