Java aracılığıyla PDF’den Tabloları Çıkarın

PDF belgesinden tabloyu ayıklayın. PDF dosyalarını programlı olarak değiştirmek için Java için Aspose.PDF dosyasını kullanın

PDF belgesinden Tablolar nasıl çıkarılır Java Kitaplığı Kullanarak

Tabloyu çıkarmak için, Java platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir dönüşüm API’si olan Java için Aspose.PDF API’sini kullanacağız. En son sürümünü doğrudan Maven adresinden indirebilir vepom.xml öğesine aşağıdaki yapılandırmaları ekleyerek Maven tabanlı projenize yükleyebilirsiniz.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Tabloları PDF’den Java aracılığıyla çıkarın


Ortamınızdaki kodu denemek için Java için Aspose.PDF gerekir.

  1. PDF’yi bir Belge örneğiyle yükleyin.
  2. Tabloları bulmak için TableAbsorber nesnesi oluşturun.
  3. Emici ile ilk sayfayı ziyaret edin.
  4. Sayfadaki ilk tabloyu alın.
  5. Tabloyu çıkarın. Dosyayı kaydedin.

PDF'den Tabloları Çıkarın - Java


    Document pdfDocument = new Document(_dataDir + "the_worlds_cities_in_2018_data_booklet 7.pdf");
    for(Page page : pdfDocument.getPages())
    {
        TableAbsorber absorber = new TableAbsorber();
        absorber.visit(page);
        for (AbsorbedTable table : absorber.getTableList())
        {
            for (AbsorbedRow row : table.getRowList())
            {
                for (AbsorbedCell cell : row.getCellList())
                {
                    TextFragmentCollection textFragmentCollection = cell.getTextFragments();
                    for (TextFragment fragment : textFragmentCollection)
                    {
                        String txt = "";
                        for (TextSegment seg : fragment.getSegments())
                            txt += seg.getText();
                        System.out.println(txt);
                    }
                }
            }
        }
    }