แยกตารางจาก PDF ผ่าน C#

แยกตารางจากเอกสาร PDFใช้ Aspose.PDF สำหรับ .NET เพื่อแก้ไขไฟล์ PDF แบบโปรแกรม

วิธีการแยกตารางจากเอกสาร PDF โดยใช้ .NET ห้องสมุด

เพื่อที่จะดึงตารางเราจะใช้ Aspose.PDF for .NET API ซึ่งเป็นคุณลักษณะที่อุดมไปด้วยที่มีประสิทธิภาพและง่ายต่อการใช้ API การจัดการเอกสาร net แพลตฟอร์มเปิดตัวจัดการแพคเกจ NuGet ค้นหาaspose.pdf และติดตั้งนอกจากนี้คุณยังอาจใช้คำสั่งต่อไปนี้จากคอนโซลการจัดการแพคเกจ

Package Manager Console

PM > Install-Package Aspose.PDF

แยกตารางจาก PDF ผ่าน C#


คุณจำเป็นต้อง Aspose.PDF for .NET ที่จะลองรหัสในสภาพแวดล้อมของคุณ

1.นำเข้าห้องสมุดที่จำเป็น 1.โหลดเอกสาร PDF 1.เริ่ม “TableAbsorber” และทำซ้ำบนหน้า 1.แยกเนื้อหาตาราง 1.บันทึกข้อมูลที่แยกออกมา (ไม่จำเป็น)

แยกตารางจาก PDF - C#

var pdfDocument = new Aspose.Pdf.Document("sample.pdf");
foreach (var page in pdfDocument.Pages)
{
    var absorber = new Aspose.Pdf.Text.TableAbsorber();
    absorber.Visit(page);
    foreach (var table in absorber.TableList)
    {
        foreach (var row in table.RowList)
        {
            foreach (var cell in row.CellList)
            {
                var textfragment = new Aspose.Pdf.Text.TextFragment();
                var textFragmentCollection = cell.TextFragments;
                foreach (var fragment in textFragmentCollection)
                {
                    string txt = "";
                    foreach (var seg in fragment.Segments)
                    {
                        txt += seg.Text;
                    }
                    Console.WriteLine(txt);
                }
            }
        }
    }
}