แยกเอกสารออกเป็นส่วนๆ ใน Java

ไลบรารี Java ที่รวดเร็วเพื่อแบ่งเอกสารเป็นกลุ่มของไฟล์ที่มีขนาดเล็กกว่าตามเกณฑ์ที่กำหนด

ใช้ไลบรารี Java เพื่อแบ่งเอกสารออกเป็นส่วนๆ คุณสามารถรวมหน้าที่แยกออกมากับข้อมูลอื่น ๆ และด้วยเหตุนี้ คุณจะได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยกเอกสารเป็นส่วนๆ ช่วยให้ทำงานร่วมกันได้ง่ายขึ้น

ดูข้อมูลโค้ด

แยกไฟล์ PDF โดยใช้ Java

ไลบรารีซอฟต์แวร์นี้มีชุดฟังก์ชันสำหรับนักพัฒนา Java เพื่อแยกเอกสาร Word, PDF, EPUB, HTML, DOCX ออกเป็นส่วนๆ สามารถใช้การแยกข้อความเป็นไฟล์แยกกันเพื่อให้ทำงานกับส่วนต่างๆ ของเอกสารได้ง่ายขึ้น ขั้นตอนการแยกเอกสารสามารถเป็นส่วนหนึ่งของเทคโนโลยีในการรวมข้อมูลเข้ากับระบบข้อมูลอัตโนมัติหรือฐานข้อมูล

ไลบรารีของเราให้นักพัฒนา Java มีฟังก์ชันที่จำเป็นทั้งหมดสำหรับเอกสารและการแยกหน้าเอกสารตามโหมดที่ระบุ นี่เป็นโซลูชัน Java แบบสแตนด์อโลนที่ไม่ต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่นๆ

แบ่งเอกสารออกเป็นส่วนๆ โดยใช้ Java

แยกเนื้อหาเอกสารโดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Java คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้: 'แยกตามหัวเรื่อง', 'แยกตามส่วน', 'แยกหน้าทีละหน้า', 'แยกตามช่วงหน้า'

หลังจากแยกเอกสารแล้ว คุณสามารถส่งออกผลลัพธ์ไปยังรูปแบบไฟล์ที่ต้องการได้โดยใช้วิธี 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วนของเอกสารเป็นรูปแบบ HTML หรือ EPUB ได้โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะทำให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้

แยกเอกสารอย่างง่ายดายด้วยโซลูชันของเราสำหรับ Java ตัวอย่างต่อไปนี้แสดงวิธีการแยกเอกสารโดยใช้ Java:

ตัวอย่างโค้ดใน Java เพื่อแบ่งเอกสารออกเป็นส่วนๆ
อัปโหลดไฟล์ที่คุณต้องการแยก
รันโค้ด
เลือกรูปแบบเป้าหมายจากรายการ
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>
สำเนา
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
สำเนา
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
สำเนา
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
สำเนา
import com.aspose.words.*;

Document doc = new Document("Input.docx");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.docx", page + 1));
}
รันโค้ด

วิธีแยก Word, PDF, HTML และรูปแบบไฟล์อื่นๆ ใน Java

  1. ติดตั้งไลบรารี Java เพื่อแยกเอกสารโดยทางโปรแกรม
  2. เพิ่มการอ้างอิงไลบรารี (นำเข้าไลบรารี) ไปยังโปรเจ็กต์ Java ของคุณ
  3. เปิดเอกสารต้นทางใน Java
  4. เรียกเมธอด extractPages() เพื่อดึงหน้าเฉพาะออกจากเอกสารของคุณ
  5. รับผลการแยกเอกสารเป็นไฟล์แยกกัน

Java ไลบรารี่เพื่อแยกไฟล์

เราโฮสต์ Java ของเราในที่เก็บ Maven 'Aspose.Words สำหรับ Java' เป็น JAR ทั่วไปที่มีโค้ดไบต์ โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้งในสภาพแวดล้อมนักพัฒนา Java ของคุณ

ความต้องการของระบบ

Java SE 7 และ Java เวอร์ชันล่าสุด นอกจากนี้เรายังมีแพ็คเกจแยกต่างหากสำหรับ Java SE 6 ในกรณีที่คุณจำเป็นต้องใช้งาน JRE ล้าสมัยนี้

Java ของเราเป็นแบบข้ามแพลตฟอร์มและทำงานบนระบบปฏิบัติการทั้งหมดที่มีการใช้งาน JVM Microsoft Windows, Linux, macOS, Android และ iOS

สำหรับข้อมูลเกี่ยวกับการพึ่งพาแพ็คเกจเสริม เช่น JogAmp JOGL, Harfbuzz ฟอนต์ Java Advanced Imaging JAI โปรดดู เอกสารประกอบผลิตภัณฑ์

รูปแบบไฟล์ที่นิยมใช้สำหรับการแตกไฟล์

5%

สมัครสมาชิก Aspose Product Updates

รับจดหมายข่าวและข้อเสนอรายเดือนที่ส่งตรงถึงกล่องจดหมายของคุณ