Java aracılığıyla PDF’den Tabloları Çıkarın

PDF belgesinden tabloyu ayıklayın. PDF dosyalarını programlı olarak değiştirmek için Java için Aspose.PDF dosyasını kullanın

PDF belgesinden Tablolar nasıl çıkarılır Java Kitaplığı Kullanarak

Tabloyu çıkarmak için, Java platformu için zengin özelliklere sahip, güçlü ve kullanımı kolay bir dönüşüm API’si olan Java için Aspose.PDF API’sini kullanacağız. En son sürümünü doğrudan Maven adresinden indirebilir vepom.xml öğesine aşağıdaki yapılandırmaları ekleyerek Maven tabanlı projenize yükleyebilirsiniz.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Tabloları PDF’den Java aracılığıyla çıkarın


Ortamınızdaki kodu denemek için Java için Aspose.PDF gerekir.

  1. Gerekli Kütüphaneleri İçe Aktar
  2. PDF Belgesini Yükle
  3. TableAbsorber öğesini başlatın ve sayfalar üzerinde yineleyin
  4. Tablo içeriğini ayıklayın
  5. Çıkarılan verileri kaydet (isteğe bağlı)

PDF'den Tabloları Çıkarın - Java

Document pdfDocument = new Document(DATA_DIR.resolve("sample.pdf").toString());
for (Page page : pdfDocument.getPages()) {
    TableAbsorber absorber = new TableAbsorber();
    absorber.visit(page);

    for (AbsorbedTable table : absorber.getTableList()) {
        for (AbsorbedRow row : table.getRowList()) {
            for (AbsorbedCell cell : row.getCellList()) {
                StringBuilder cellText = new StringBuilder();

                for (TextFragment fragment : cell.getTextFragments()) {
                    for (TextSegment segment : fragment.getSegments()) {
                        cellText.append(segment.getText());
                    }
                }

                System.out.println(cellText);
            }
        }
    }
}
pdfDocument.close();