Ekstrak Tabel dari PDF melalui C#

Ekstrak tabel dari dokumen PDF. Gunakan Aspose.PDF untuk .NET untuk memodifikasi file PDF secara terprogram

Cara mengekstrak Tabel dari dokumen PDF Menggunakan .NET Library

Untuk mengekstrak tabel, kita akan menggunakan API Aspose.PDF for .NET yang merupakan API manipulasi dokumen yang kaya fitur, kuat dan mudah digunakan untuk platform net. Buka manajer paket nuget, cari Aspose.pdf dan instal. Anda juga dapat menggunakan perintah berikut dari Konsol Manajer Paket.

Package Manager Console

PM > Install-Package Aspose.PDF

Ekstrak Tabel dari PDF melalui C#


Anda perlu Aspose.PDF for .NET untuk mencoba kode di lingkungan Anda.

  1. Impor Perpustakaan yang Diperlukan
  2. Muat Dokumen PDF
  3. Inisialisasi TableAbsorber dan ulangi halaman
  4. Ekstrak konten tabel
  5. Simpan data yang diekstraksi (opsional)

Ekstrak Tabel dari PDF - C#

var pdfDocument = new Aspose.Pdf.Document("sample.pdf");
foreach (var page in pdfDocument.Pages)
{
    var absorber = new Aspose.Pdf.Text.TableAbsorber();
    absorber.Visit(page);
    foreach (var table in absorber.TableList)
    {
        foreach (var row in table.RowList)
        {
            foreach (var cell in row.CellList)
            {
                var textfragment = new Aspose.Pdf.Text.TextFragment();
                var textFragmentCollection = cell.TextFragments;
                foreach (var fragment in textFragmentCollection)
                {
                    string txt = "";
                    foreach (var seg in fragment.Segments)
                    {
                        txt += seg.Text;
                    }
                    Console.WriteLine(txt);
                }
            }
        }
    }
}