แยก HTML ออกเป็นส่วนๆ ใน Java

ไลบรารี Java ที่รวดเร็วเพื่อแบ่งไฟล์ HTML ไฟล์ออกเป็นกลุ่มของไฟล์ที่เล็กกว่าตามเกณฑ์ที่กำหนด

ใช้ไลบรารี Java เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ คุณสามารถรวมหน้า HTML ที่แยกออกมากับข้อมูลอื่น และทำให้ได้รับเอกสารของแบบฟอร์มและเนื้อหาที่คุณต้องการ การแยก HTML ออกเป็นส่วนๆ ทำให้ทำงานร่วมกันในไฟล์ HTML ได้ง่ายขึ้น

ดูข้อมูลโค้ด

แยก HTML โดยใช้ Java

ไลบรารีซอฟต์แวร์นี้มีชุดฟังก์ชันสำหรับนักพัฒนา Java เพื่อแยกไฟล์ HTML ออกเป็นส่วนๆ การแยกไฟล์ HTML ออกเป็นไฟล์แยกกัน สามารถใช้เพื่อให้ทำงานกับส่วนต่างๆ ของเอกสารแบบคู่ขนานกันได้ง่ายขึ้น ตัวอย่างเช่น หากมีคนหลายคนกำลังทำงานบน HTML หนึ่งรายการพร้อมกัน การแยก HTML จะช่วยให้พวกเขาทำงานได้เร็วขึ้น การแยก HTML อาจเป็นส่วนหนึ่งของเทคโนโลยีสำหรับการดึงข้อความจากไฟล์ HTML และการรวมข้อมูลเข้ากับระบบข้อมูลอัตโนมัติหรือฐานข้อมูล

ไลบรารีของเรามีฟังก์ชันที่จำเป็นทั้งหมดสำหรับนักพัฒนา Java เพื่อแยก HTML ออกเป็นส่วนๆ และแยกหน้าตามโหมดที่ระบุ นี่เป็นโซลูชัน Java แบบสแตนด์อโลนที่ไม่ต้องติดตั้ง Microsoft Word, Acrobat Reader หรือแอปพลิเคชันอื่นๆ

แยกไฟล์ HTML ออกเป็นส่วนๆ ในโค้ด Java

แยกเนื้อหา HTML โดยใช้เกณฑ์ที่แตกต่างกันในโค้ด Java คุณสามารถใช้โหมดการแยกหน้าต่อไปนี้สำหรับไฟล์ HTML: 'แยกตามส่วนหัว', 'แยกตามส่วน', 'แยกหน้าทีละหน้า', 'แยกตามช่วงหน้า'

หลังจากแยกไฟล์ HTML ออกเป็นส่วนๆ แล้ว คุณสามารถส่งออกผลลัพธ์ไปยังรูปแบบไฟล์ที่ต้องการได้โดยใช้วิธี 'Document.Save' คุณยังสามารถควบคุมวิธีการส่งออกส่วน HTML เป็น HTML หรือ EPUB โดยใช้คุณสมบัติ 'DocumentPartSavingCallback' ซึ่งจะทำให้คุณสามารถเปลี่ยนเส้นทางสตรีมเอาต์พุตได้

แยกเอกสาร HTML อย่างง่ายดายด้วยโซลูชันของเราสำหรับ Java ตัวอย่างต่อไปนี้แสดงวิธีแยก HTML โดยใช้ Java:

Java ตัวอย่างโค้ดเพื่อแบ่ง HTML file
อัปโหลดไฟล์ที่คุณต้องการแยก
รันโค้ด
เลือกรูปแบบเป้าหมายจากรายการ
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>
สำเนา
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
สำเนา
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
สำเนา
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
สำเนา
import com.aspose.words.*;

Document doc = new Document("Input.html");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.html", page + 1));
}
รันโค้ด

วิธีแยก HTML ใน Java

  1. ติดตั้งไลบรารี Java เพื่อแยกไฟล์ HTML ไฟล์โดยทางโปรแกรม
  2. เพิ่มการอ้างอิงไลบรารี (นำเข้าไลบรารี) ไปยังโปรเจ็กต์ Java ของคุณ
  3. เปิด HTML ใน Java
  4. เรียกเมธอด extractPages() เพื่อดึงข้อมูลบางหน้าออกจาก HTML
  5. รับผลลัพธ์จากการแยก HTML เป็นไฟล์แยกกัน

Java ห้องสมุดเพื่อแยก HTML เอกสาร

เราโฮสต์ Java ของเราในที่เก็บ Maven 'Aspose.Words สำหรับ Java' เป็น JAR ทั่วไปที่มีโค้ดไบต์ โปรดปฏิบัติตาม คำแนะนำทีละขั้นตอน เกี่ยวกับวิธีการติดตั้งในสภาพแวดล้อมนักพัฒนา Java ของคุณ

ความต้องการของระบบ

Java SE 7 และ Java เวอร์ชันล่าสุด นอกจากนี้เรายังมีแพ็คเกจแยกต่างหากสำหรับ Java SE 6 ในกรณีที่คุณจำเป็นต้องใช้งาน JRE ล้าสมัยนี้

Java ของเราเป็นแบบข้ามแพลตฟอร์มและทำงานบนระบบปฏิบัติการทั้งหมดที่มีการใช้งาน JVM Microsoft Windows, Linux, macOS, Android และ iOS

สำหรับข้อมูลเกี่ยวกับการพึ่งพาแพ็คเกจเสริม เช่น JogAmp JOGL, Harfbuzz ฟอนต์ Java Advanced Imaging JAI โปรดดู เอกสารประกอบผลิตภัณฑ์

การดำเนินการแยกอื่นๆ ที่รองรับ HTML

คุณยังสามารถแบ่ง HTML เป็นรูปแบบไฟล์อื่นได้:

5%

สมัครสมาชิก Aspose Product Updates

รับจดหมายข่าวและข้อเสนอรายเดือนที่ส่งตรงถึงกล่องจดหมายของคุณ