Tabloları PDF belgesinden Java aracılığıyla ayıklayın

Java Kütüphane kullanarak PDF’den Tablo nasıl çıkarılır

PDF belgesinden Tablolar nasıl çıkarılır Java Kitaplığı Kullanarak

Tabloyu çıkarmak için, Java platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir dönüşüm API’si olan Java için Aspose.PDF API’sini kullanacağız. En son sürümünü doğrudan Maven adresinden indirebilir vepom.xml öğesine aşağıdaki yapılandırmaları ekleyerek Maven tabanlı projenize yükleyebilirsiniz.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Tabloları PDF’den Java aracılığıyla çıkarın


Ortamınızdaki kodu denemek için Java için Aspose.PDF gerekir.

  1. PDF’yi bir Belge örneğiyle yükleyin.
  2. Tabloları bulmak için TableAbsorber nesnesi oluşturun.
  3. Emici ile ilk sayfayı ziyaret edin.
  4. Sayfadaki ilk tabloyu alın.
  5. Tabloyu çıkarın. Dosyayı kaydedin.

PDF'den Tabloları Çıkarın - Java.


    Document pdfDocument = new Document(_dataDir + "the_worlds_cities_in_2018_data_booklet 7.pdf");
    for(Page page : pdfDocument.getPages())
    {
        TableAbsorber absorber = new TableAbsorber();
        absorber.visit(page);
        for (AbsorbedTable table : absorber.getTableList())
        {
            for (AbsorbedRow row : table.getRowList())
            {
                for (AbsorbedCell cell : row.getCellList())
                {
                    TextFragmentCollection textFragmentCollection = cell.getTextFragments();
                    for (TextFragment fragment : textFragmentCollection)
                    {
                        String txt = "";
                        for (TextSegment seg : fragment.getSegments())
                            txt += seg.getText();
                        System.out.println(txt);
                    }
                }
            }
        }
    }