قابلیت استخراج جداول از سند پی دی اف از طریق Java

نحوه استخراج جدول از PDF با استفاده از Java کتابخانه

نحوه استخراج جداول از سند PDF با استفاده از کتابخانه Java

به منظور استخراج جدول، ما از API Aspose.PDF for Java استفاده خواهیم کرد که یک API تبدیل قدرتمند، قدرتمند و آسان برای استفاده برای پلت فرم جاوا است. می توانید آخرین نسخه آن را مستقیماً از MAVEN بارگیری کرده و با افزودن تنظیمات زیر به pom.xml، آن را در پروژه مبتنی بر Maven خود نصب کنید.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

قابلیت استخراج جداول از پی دی اف از طریق Java


شما نیاز به Aspose.PDF for Java به سعی کنید کد در محیط شما.

۱. PDF را با نمونه ای از سند بارگذاری کنید. ۱. ایجاد شیء TableAbsorber برای پیدا کردن جداول. ۱. بازدید از صفحه اول با جذب. ۱. اولین جدول را در صفحه دریافت کنید ۱. جدول را بردارید فایل را ذخیره کنید

قابلیت استخراج جداول از پی دی اف - Java


    Document pdfDocument = new Document(_dataDir + "the_worlds_cities_in_2018_data_booklet 7.pdf");
    for(Page page : pdfDocument.getPages())
    {
        TableAbsorber absorber = new TableAbsorber();
        absorber.visit(page);
        for (AbsorbedTable table : absorber.getTableList())
        {
            for (AbsorbedRow row : table.getRowList())
            {
                for (AbsorbedCell cell : row.getCellList())
                {
                    TextFragmentCollection textFragmentCollection = cell.getTextFragments();
                    for (TextFragment fragment : textFragmentCollection)
                    {
                        String txt = "";
                        for (TextSegment seg : fragment.getSegments())
                            txt += seg.getText();
                        System.out.println(txt);
                    }
                }
            }
        }
    }