استخراج جداول از PDF از طریق C#

جدول را از سند PDF استخراج کنید. از Aspose.PDF برای .NET برای اصلاح فایل های PDF به صورت برنامه نویسی استفاده کنید

نحوه استخراج جداول از سند PDF با استفاده از کتابخانه .NET

به منظور استخراج جدول، ما از API Aspose.PDF for .NET استفاده خواهیم کرد که یک API دستکاری اسناد غنی، قدرتمند و آسان برای استفاده برای پلتفرم net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Package Manager Console

PM > Install-Package Aspose.PDF

قابلیت استخراج جداول از پی دی اف از طریق C#


شما نیاز به Aspose.PDF for .NET دارید تا کد را در محیط خود امتحان کنید.

۱. وارد کردن کتابخانه های لازم ۱. سند PDF را بارگذاری کنید ۱. TableAbsorber را اولیه کنید و روی صفحات تکرار کنید ۱. استخراج محتوای جدول ۱. ذخیره داده های استخراج شده (اختیاری)

قابلیت استخراج جداول از پی دی اف - C#

var pdfDocument = new Aspose.Pdf.Document("sample.pdf");
foreach (var page in pdfDocument.Pages)
{
    var absorber = new Aspose.Pdf.Text.TableAbsorber();
    absorber.Visit(page);
    foreach (var table in absorber.TableList)
    {
        foreach (var row in table.RowList)
        {
            foreach (var cell in row.CellList)
            {
                var textfragment = new Aspose.Pdf.Text.TextFragment();
                var textFragmentCollection = cell.TextFragments;
                foreach (var fragment in textFragmentCollection)
                {
                    string txt = "";
                    foreach (var seg in fragment.Segments)
                    {
                        txt += seg.Text;
                    }
                    Console.WriteLine(txt);
                }
            }
        }
    }
}