استخراج جداول از PDF از طریق C#

جدول را از سند PDF استخراج کنید. از Aspose.PDF برای .NET برای اصلاح فایل های PDF به صورت برنامه نویسی استفاده کنید

نحوه استخراج جداول از سند PDF با استفاده از کتابخانه .NET

به منظور استخراج جدول، ما از API Aspose.PDF for .NET استفاده خواهیم کرد که یک API دستکاری اسناد غنی، قدرتمند و آسان برای استفاده برای پلتفرم net است. مدیر بسته NuGet را باز کنید، aspose.pdf را جستجو کرده و نصب کنید. شما همچنین می توانید از دستور زیر از کنسول مدیریت بسته استفاده کنید.

Package Manager Console

PM > Install-Package Aspose.PDF

قابلیت استخراج جداول از پی دی اف از طریق C#


شما نیاز به Aspose.PDF for .NET دارید تا کد را در محیط خود امتحان کنید.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. ایجاد شیء TableAbsorber برای پیدا کردن جداول. ۱. بازدید از صفحه اول با جذب. ۱. اولین جدول را در صفحه دریافت کنید ۱. جدول را بردارید فایل را ذخیره کنید

قابلیت استخراج جداول از پی دی اف - C#


Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(@"c:\tmp\the_worlds_cities_in_2018_data_booklet 7.pdf");           
    foreach (var page in pdfDocument.Pages)
    {
        Aspose.Pdf.Text.TableAbsorber absorber = new Aspose.Pdf.Text.TableAbsorber();
        absorber.Visit(page);
        foreach (AbsorbedTable table in absorber.TableList)
        {
            foreach (AbsorbedRow row in table.RowList)
            {
                foreach (AbsorbedCell cell in row.CellList)
                {
                    TextFragment textfragment = new TextFragment();
                    TextFragmentCollection textFragmentCollection = cell.TextFragments;
                    foreach (TextFragment fragment in textFragmentCollection)
                    {
                        string txt = "";
                        foreach (TextSegment seg in fragment.Segments)
                        {
                            txt += seg.Text;
                        }
                        Console.WriteLine(txt);
                    }
                }
            }
        }
    }