Разделите PDF-файл с помощью файла Aspose.PDF для Java

Разделение файлов с помощью библиотеки Aspose.PDF для Java.

Разделение файлов с помощью файла Aspose.PDF для Java

Нужна только часть больших файлов? Чтобы отделить одну или несколько частей от документа, необходимо разделить страницы исходного файла. Для разделения файлов мы будем использовать API Aspose.PDF для Java, который представляет собой многофункциональный, мощный и простой в использовании API конвертации для платформы Java. Последнюю версию можно загрузить непосредственно с сайта Maven и установить ее в свой проект на базе Maven, добавив в pom.xml следующие конфигурации. Наш программный инструмент также позволяет разработчикам разделять документы Word, PDF, HTML, TXT и DOCX на части. Для получения дополнительной информации ознакомьтесь с Страницы документации.

Repository

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java AP</name>
    <url>https://releases.aspose.com/java/repo/</url>
</repository>

Dependency

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>version of aspose-pdf API</version>
</dependency>

Разделите документы с помощью Java


Вам понадобится Aspose.PDF for Java, чтобы попробовать код в своей среде.

  1. Загрузите PDF-файл с экземпляром документа.
  2. Создайте новый объект класса Document для разделения страниц PDF.
  3. Добавьте текущую страницу в документ.
  4. Сохранить текущую страницу как отдельный PDF-файл

Как разделить PDF-файл с помощью Java

С помощью библиотеки Aspose.PDF для Java можно разделить большие PDF-документы. Разделение PDF-документа — распространенный вариант использования при работе с PDF-документами. Это помогает уменьшить размер PDF-файла, разбивая большие документы на файлы меньшего размера для отправки по электронной почте.

Разделить PDF на части - Java

В этом примере кода показано, как разделить PDF-файл - Java

    //Read the source PDF file
    doc = new com.aspose.pdf.Document("1.pdf");
    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //Split the PDF file into two halves
    pdfEditor.extract(pathSource, 1, doc.getPages().size() / 2, "pdf_half.pdf");

Как разделить HTML-файлы с помощью Java

HTML-документы могут быть большими, так как они могут содержать текст, изображения, диаграммы и многое другое. Возможно, вам придется разделить HTML-файлы в соответствии с различными требованиями или вариантами использования. В решении этой задачи вам поможет библиотека Aspose.PDF для Java.

Разделите HTML на Java

В этом примере кода показано, как разделить HTML-файл - Java

    //Read the source HTML file
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.HtmlLoadOptions());

    //save input html to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();

    //slit first page
    pdfEditor.splitFromFirst("test.pdf", 1, "test.pdf");

    //Convert first pdf page to html
    outputDoc = new com.aspose.pdf.Document("test.pdf");
    outputDoc.save("first_page.html", com.aspose.pdf.SaveFormat.Html);

Как разделить файлы TXT с помощью Java

Библиотека Aspose.PDF для Java позволяет разработчикам Java разделять файлы TXT на отдельные части. Функция разделения TXT-документа на отдельные файлы поможет работать с разными разделами большого документа одновременно и для нескольких пользователей. Разделение документа TXT ускорит и упростит вашу работу. Используйте следующий фрагмент кода для извлечения страниц вашего TXT-файла.

Разделить TXT на разделенный текст - Java

В этом примере кода показано, как разделить TXT-файл - Java

    //Read the source TXT file to Aspose Document
    doc = new com.aspose.pdf.Document(pathSource, new com.aspose.pdf.TxtLoadOptions());

    //Instantiate PdfFileEditor object
    pdfEditor = new com.aspose.pdf.facades.PdfFileEditor();


    //save input text to pdf to file
    doc.save("test.pdf", com.aspose.pdf.SaveFormat.Pdf);

    //split pdf to pages
    ByteArrayInputStream[] pages = pdfEditor.splitToPages("test.pdf");
    int index = 1;

    //5. save each page to text file
    //extract text from page
    for(var ms : pages) {
        page = new com.aspose.pdf.Document(ms);
        textAbsorber = new com.aspose.pdf.TextAbsorber();
        page.getPages().accept(textAbsorber);
        String extractedText = textAbsorber.getText();
        Files.writeString(Path.of("text_"+ Integer.toString(index)+".txt"), extractedText);
        index++;
    }