เพื่อที่จะดึงตารางเราจะใช้ Aspose.PDF for Java API ซึ่งเป็นคุณลักษณะที่อุดมไปด้วยที่มีประสิทธิภาพและง่ายต่อการใช้ API แปลงสำหรับแพลตฟอร์ม Javaคุณสามารถดาวน์โหลดรุ่นล่าสุดได้โดยตรงจาก Maven และติดตั้งภายในโครงการ Maven ตามของคุณโดยการเพิ่มการกำหนดค่าต่อไปนี้เพื่อpom.xml
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java AP</name>
<url>https://releases.aspose.com/java/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>
แยกตารางจาก PDF ผ่าน Java
คุณจำเป็นต้อง Aspose.PDF forห้องสมุด Java เพื่อลองรหัสในสภาพแวดล้อมของคุณ
1.โหลดไฟล์ PDF ที่มีอินสแตนซ์ของเอกสาร
1.สร้างวัตถุ TableAbsorber เพื่อหาตาราง
1.เยี่ยมชมหน้าแรกที่มีโช้ค
1.รับตารางแรกบนหน้าเว็บ
1.เอาตารางออกบันทึกแฟ้ม
แยกตารางจาก PDF - Java
Document pdfDocument = new Document(_dataDir + "the_worlds_cities_in_2018_data_booklet 7.pdf");
for(Page page : pdfDocument.getPages())
{
TableAbsorber absorber = new TableAbsorber();
absorber.visit(page);
for (AbsorbedTable table : absorber.getTableList())
{
for (AbsorbedRow row : table.getRowList())
{
for (AbsorbedCell cell : row.getCellList())
{
TextFragmentCollection textFragmentCollection = cell.getTextFragments();
for (TextFragment fragment : textFragmentCollection)
{
String txt = "";
for (TextSegment seg : fragment.getSegments())
txt += seg.getText();
System.out.println(txt);
}
}
}
}
}