แยกไฟล์ผ่าน Java

ไฟล์แยกด้วยความช่วยเหลือของฝั่งเซิร์ฟเวอร์ Java ห้องสมุด

แยกไฟล์โดยใช้ไลบรารี Java

ต้องการเพียงส่วนหนึ่งของไฟล์ขนาดใหญ่ของคุณ?เมื่อต้องการแยกชิ้นส่วนอย่างน้อยหนึ่งส่วนออกจากเอกสารของคุณคุณต้องแยกหน้าของไฟล์ต้นฉบับเพื่อที่จะแยกไฟล์เราจะใช้ Aspose.PDF for Java API ซึ่งเป็นคุณลักษณะที่อุดมไปด้วยที่มีประสิทธิภาพและง่ายต่อการใช้ API แปลงสำหรับแพลตฟอร์ม Javaคุณสามารถดาวน์โหลดรุ่นล่าสุดได้โดยตรงจาก Maven และติดตั้งภายในโครงการ Maven ตามของคุณโดยการเพิ่มการกำหนดค่าต่อไปนี้เพื่อpom.xmlเครื่องมือซอฟต์แวร์ของเรายังให้นักพัฒนาสามารถแยกเอกสาร Word, PDF, HTML, TXT และ DOCX ออกเป็นส่วน ๆสำหรับรายละเอียดเพิ่มเติมโปรดดู หน้าเอกสาร

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

แยกเอกสารผ่าน Java


คุณจำเป็นต้อง Aspose.PDF forห้องสมุด Java เพื่อลองรหัสในสภาพแวดล้อมของคุณ

1.โหลดไฟล์ PDF ที่มีอินสแตนซ์ของเอกสาร 1.สร้างวัตถุชั้นเอกสารใหม่ที่จะแยกหน้า PDF 1.เพิ่มหน้าปัจจุบันลงในเอกสาร 1.บันทึกหน้าปัจจุบันเป็น PDF แยกต่างหาก

วิธีการแยกไฟล์ PDF โดยใช้ Java

ด้วย Aspose.PDF สำหรับห้องสมุด Java คุณสามารถแยกเอกสาร PDF ขนาดใหญ่การแยกเอกสาร PDF เป็นกรณีการใช้งานทั่วไปเมื่อทำงานกับเอกสาร PDFมันช่วยลดขนาดของไฟล์ PDF โดยแบ่งเอกสารขนาดใหญ่เป็นไฟล์ขนาดเล็กเพื่อส่งผ่านทางอีเมล

แยกไฟล์ PDF - Java

<% splitter.code-block1.subtitle %>

    //Read the source PDF file
    doc = new com.aspose.pdf.Document("1.pdf");
    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //Split the PDF file into two halves
    pdfEditor.extract(pathSource, 1, doc.getPages().size() / 2, "pdf_half.pdf");

วิธีการแยกไฟล์ HTML โดยใช้ Java

เอกสาร HTML สามารถมีขนาดใหญ่ที่พวกเขาสามารถมีข้อความ, ภาพ, แผนภูมิและอื่น ๆคุณอาจต้องแยกไฟล์ HTML ตามความต้องการที่แตกต่างกันหรือกรณีการใช้งานAspose.PDF สำหรับห้องสมุด Java จะช่วยให้คุณมีงานนี้

สปลิต HTML - Java

<% splitter.code-block2.subtitle %>

    //Read the source HTML file
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.HtmlLoadOptions());

    //save input html to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //slit first page
    pdfEditor.splitFromFirst("test.pdf", 1, "test.pdf");

    //Convert first pdf page to html
    outputDoc = new com.aspose.pdf.Document("test.pdf");
    outputDoc.save("first_page.html", com.aspose.pdf.SaveFormat.Html);

วิธีการแยกไฟล์ TXT โดยใช้ Java

Aspose.PDF สำหรับห้องสมุด Java ช่วยให้นักพัฒนา Java สามารถแยกไฟล์ TXT ออกเป็นส่วนที่แยกต่างหากฟังก์ชั่นการแยกเอกสาร TXT เป็นไฟล์แยกต่างหากจะช่วยให้คุณทำงานกับส่วนต่างๆของเอกสารขนาดใหญ่ในเวลาเดียวกันและสำหรับผู้ใช้หลายคนการแยกเอกสาร TXT จะช่วยเพิ่มความเร็วและปรับปรุงการทำงานของคุณใช้โค้ดต่อไปนี้เพื่อดึงหน้าของไฟล์ TXT ของคุณ

แยก TXT - Java

<% splitter.code-block3.subtitle %>

    //Read the source TXT file to Aspose Document
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.TxtLoadOptions());

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();


    //save input text to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //split pdf to pages
    ByteArrayInputStream[] pages = pdfEditor.splitToPages("test.pdf");
    int index = 1;

    //5. save each page to text file
    //extract text from page
    for(var ms : pages) {
        page = new com.aspose.pdf.Document(ms);
        textAbsorber = new com.aspose.pdf.TextAbsorber();
        page.getPages().accept(textAbsorber);
        String extractedText = textAbsorber.getText();
        Files.writeString(Path.of("text_"+ Integer.toString(index)+".txt"), extractedText);
        index++;
    }