استخراج جداول از PDF از طریق Java

جدول را از سند PDF استخراج کنید. از Aspose.PDF برای Java برای اصلاح فایل های PDF به صورت برنامه نویسی استفاده کنید

C# Java C++ Python

نحوه استخراج جداول از سند PDF با استفاده از کتابخانه Java

به منظور استخراج جدول، ما از API Aspose.PDF for Java استفاده خواهیم کرد که یک API تبدیل قدرتمند، قدرتمند و آسان برای استفاده برای پلت فرم جاوا است. می توانید آخرین نسخه آن را مستقیماً از Maven بارگیری کرده و با افزودن تنظیمات زیر به pom.xml، آن را در پروژه مبتنی بر Maven خود نصب کنید.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

قابلیت استخراج جداول از پی دی اف از طریق Java

شما نیاز به Aspose.PDF for Java به سعی کنید کد در محیط شما.

۱. وارد کردن کتابخانه های لازم ۱. سند PDF را بارگذاری کنید ۱. TableAbsorber را اولیه کنید و روی صفحات تکرار کنید ۱. استخراج محتوای جدول ۱. ذخیره داده های استخراج شده (اختیاری)

قابلیت استخراج جداول از پی دی اف - Java

Document pdfDocument = new Document(DATA_DIR.resolve("sample.pdf").toString());
for (Page page : pdfDocument.getPages()) {
    TableAbsorber absorber = new TableAbsorber();
    absorber.visit(page);

    for (AbsorbedTable table : absorber.getTableList()) {
        for (AbsorbedRow row : table.getRowList()) {
            for (AbsorbedCell cell : row.getCellList()) {
                StringBuilder cellText = new StringBuilder();

                for (TextFragment fragment : cell.getTextFragments()) {
                    for (TextSegment segment : fragment.getSegments()) {
                        cellText.append(segment.getText());
                    }
                }

                System.out.println(cellText);
            }
        }
    }
}
pdfDocument.close();