Dividir archivos mediante Java

División de archivos con la ayuda de la biblioteca Java del lado del servidor.

Dividir archivos mediante la biblioteca Java

¿Necesitas solo una parte de tus archivos de gran tamaño? Para separar una o más partes del documento, debe dividir las páginas del archivo original. Para dividir archivos, utilizaremos la API Aspose.PDF for Java, que es una API de conversión para la plataforma Java rica en funciones, potente y fácil de usar. Puedes descargar su última versión directamente desde Maven e instalarla en tu proyecto basado en Maven añadiendo las siguientes configuraciones al pom.xml. Nuestra herramienta de software también permite a los desarrolladores dividir documentos de Word, PDF, HTML, TXT y DOCX en partes. Para obtener más información, consulte Páginas de documentación.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Dividir documentos mediante Java


Necesita Aspose.PDF for Java para probar el código en su entorno.

  1. Cargue el PDF con una instancia de Document.
  2. Cree un nuevo objeto de clase Document para dividir páginas PDF.
  3. Agregue la página actual al documento.
  4. Guardar la página actual como un PDF independiente

Cómo dividir archivos PDF con Java

Con la biblioteca Aspose.PDF para Java, puede dividir documentos PDF de gran tamaño. Dividir un documento PDF es un caso de uso común cuando se trabaja con documentos PDF. Ayuda a reducir el tamaño de un archivo PDF al dividir documentos grandes en archivos más pequeños para enviarlos por correo electrónico.

PDF dividido - Java

<% splitter.code-block1.subtitle %>

    //Read the source PDF file
    doc = new com.aspose.pdf.Document("1.pdf");
    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //Split the PDF file into two halves
    pdfEditor.extract(pathSource, 1, doc.getPages().size() / 2, "pdf_half.pdf");

Cómo dividir archivos HTML con Java

Los documentos HTML pueden ser grandes, ya que pueden contener texto, imágenes, gráficos y mucho más. Es posible que tenga que separar los archivos HTML según los diferentes requisitos o casos de uso. La biblioteca Aspose.PDF para Java le ayudará con esta tarea.

HTML dividido: Java

<% splitter.code-block2.subtitle %>

    //Read the source HTML file
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.HtmlLoadOptions());

    //save input html to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //slit first page
    pdfEditor.splitFromFirst("test.pdf", 1, "test.pdf");

    //Convert first pdf page to html
    outputDoc = new com.aspose.pdf.Document("test.pdf");
    outputDoc.save("first_page.html", com.aspose.pdf.SaveFormat.Html);

Cómo dividir archivos TXT con Java

La biblioteca Aspose.PDF para Java permite a los desarrolladores de Java dividir los archivos TXT en partes separadas. La función de dividir un documento TXT en archivos separados le ayudará a trabajar con diferentes secciones de un documento grande al mismo tiempo y para varios usuarios. Dividir un documento TXT acelerará y agilizará tu trabajo. Usa el siguiente fragmento de código para extraer las páginas de tu archivo TXT.

TXT dividido: Java

<% splitter.code-block3.subtitle %>

    //Read the source TXT file to Aspose Document
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.TxtLoadOptions());

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();


    //save input text to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //split pdf to pages
    ByteArrayInputStream[] pages = pdfEditor.splitToPages("test.pdf");
    int index = 1;

    //5. save each page to text file
    //extract text from page
    for(var ms : pages) {
        page = new com.aspose.pdf.Document(ms);
        textAbsorber = new com.aspose.pdf.TextAbsorber();
        page.getPages().accept(textAbsorber);
        String extractedText = textAbsorber.getText();
        Files.writeString(Path.of("text_"+ Integer.toString(index)+".txt"), extractedText);
        index++;
    }