Dividir arquivos via Java

Divisão de arquivos com a ajuda da biblioteca Java do lado do servidor.

Divida arquivos usando a biblioteca Java

Precisa apenas de parte de seus arquivos grandes? Para separar uma ou mais partes do documento, você deve dividir as páginas do arquivo original. Para dividir arquivos, usaremos a API Aspose.PDF para Java, que é uma API de conversão rica em recursos, poderosa e fácil de usar para a plataforma Java. Você pode baixar a versão mais recente diretamente do Maven e instalá-la em seu projeto baseado em Maven adicionando as seguintes configurações ao pom.xml. Nossa ferramenta de software também permite que os desenvolvedores dividam documentos Word, PDF, HTML, TXT e DOCX em partes. Para obter mais detalhes, consulte Páginas de documentação.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Divida documentos via Java


Você precisa do Aspose.PDF for Java para testar o código em seu ambiente.

  1. Carregue o PDF com uma instância de Document.
  2. Crie um novo objeto de classe Document para dividir páginas PDF.
  3. Adicione a página atual ao documento.
  4. Salvar a página atual como um PDF separado

Como dividir PDF usando Java

Com a biblioteca Aspose.PDF para Java, você pode dividir documentos PDF grandes. Dividir um documento PDF é um caso de uso comum ao trabalhar com documentos PDF. Ele ajuda a reduzir o tamanho de um arquivo PDF dividindo documentos grandes em arquivos menores para enviar por e-mail.

Divida o PDF - Java

<% splitter.code-block1.subtitle %>

    //Read the source PDF file
    doc = new com.aspose.pdf.Document("1.pdf");
    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //Split the PDF file into two halves
    pdfEditor.extract(pathSource, 1, doc.getPages().size() / 2, "pdf_half.pdf");

Como dividir arquivos HTML usando Java

Os documentos HTML podem ser grandes, pois podem conter texto, imagens, gráficos e muito mais. Talvez seja necessário separar os arquivos HTML de acordo com diferentes requisitos ou casos de uso. A biblioteca Aspose.PDF para Java ajudará você nessa tarefa.

HTML dividido - Java

<% splitter.code-block2.subtitle %>

    //Read the source HTML file
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.HtmlLoadOptions());

    //save input html to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //slit first page
    pdfEditor.splitFromFirst("test.pdf", 1, "test.pdf");

    //Convert first pdf page to html
    outputDoc = new com.aspose.pdf.Document("test.pdf");
    outputDoc.save("first_page.html", com.aspose.pdf.SaveFormat.Html);

Como dividir arquivos TXT usando Java

A biblioteca Aspose.PDF for Java permite que os desenvolvedores Java dividam arquivos TXT em partes separadas. A função de dividir um documento TXT em arquivos separados ajudará você a trabalhar com diferentes seções de um documento grande ao mesmo tempo e para vários usuários. Dividir um documento TXT acelerará e simplificará seu trabalho. Use o trecho de código a seguir para extrair as páginas do seu arquivo TXT.

Divida o TXT - Java

<% splitter.code-block3.subtitle %>

    //Read the source TXT file to Aspose Document
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.TxtLoadOptions());

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();


    //save input text to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //split pdf to pages
    ByteArrayInputStream[] pages = pdfEditor.splitToPages("test.pdf");
    int index = 1;

    //5. save each page to text file
    //extract text from page
    for(var ms : pages) {
        page = new com.aspose.pdf.Document(ms);
        textAbsorber = new com.aspose.pdf.TextAbsorber();
        page.getPages().accept(textAbsorber);
        String extractedText = textAbsorber.getText();
        Files.writeString(Path.of("text_"+ Integer.toString(index)+".txt"), extractedText);
        index++;
    }