Ekstrak Tabel dari PDF melalui Java

Ekstrak tabel dari dokumen PDF. Gunakan Aspose.PDF untuk Java untuk memodifikasi file PDF secara terprogram

Cara mengekstrak Tabel dari dokumen PDF Menggunakan Java Library

Untuk mengekstrak tabel, kita akan menggunakan Aspose.PDF for Java API yang merupakan API konversi yang kaya fitur, kuat dan mudah digunakan untuk platform Java. Anda dapat mengunduh versi terbarunya langsung dari Maven dan menginstalnya dalam proyek berbasis Maven Anda dengan menambahkan konfigurasi berikut kepom.xml.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Ekstrak Tabel dari PDF melalui Java


Anda memerlukan Aspose.PDF for Java untuk mencoba kode di lingkungan Anda.

  1. Muat PDF dengan instance Document.
  2. Buat objek TableAbsorber untuk menemukan tabel.
  3. Kunjungi halaman pertama dengan absorber.
  4. Dapatkan tabel pertama pada halaman.
  5. Lepaskan tabel. Simpan file.

Ekstrak Tabel dari PDF - Java


    Document pdfDocument = new Document(_dataDir + "the_worlds_cities_in_2018_data_booklet 7.pdf");
    for(Page page : pdfDocument.getPages())
    {
        TableAbsorber absorber = new TableAbsorber();
        absorber.visit(page);
        for (AbsorbedTable table : absorber.getTableList())
        {
            for (AbsorbedRow row : table.getRowList())
            {
                for (AbsorbedCell cell : row.getCellList())
                {
                    TextFragmentCollection textFragmentCollection = cell.getTextFragments();
                    for (TextFragment fragment : textFragmentCollection)
                    {
                        String txt = "";
                        for (TextSegment seg : fragment.getSegments())
                            txt += seg.getText();
                        System.out.println(txt);
                    }
                }
            }
        }
    }