Разделить HTML на части, используя Java

Быстрая Java библиотека для разделения одного HTML файла на группу файлов меньшего размера в соответствии с заданными критериями

Используйте Java библиотеку для разделения HTML файлов на части. Вы можете интегрировать извлеченные HTML страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение HTML на части упрощает совместную работу над HTML файлами.

Посмотреть фрагмент кода

Разделить HTML с помощью Java

Эта программная библиотека предоставляет Java разработчикам набор функций для разделения HTML файлов на части. Разделение HTML на отдельные файлы может использоваться для распараллеливания работы с разделами документа. Например, если над одним HTML документом работают несколько человек одновременно, то разделение HTML позволит им ускорить работу. Разделение HTML может быть частью технологии извлечения текста из HTML файлов и интеграции данных в автоматизированные информационные системы или базы данных.

Java библиотека предоставляет разработчикам все необходимые функции для разделения HTML на части и извлечения страниц в соответствии с заданным режимом. Это автономное решение для Java, которое не требует установки офисных пакетов Microsoft Word, Acrobat Reader или других приложений.

Разбить HTML файл на части в коде Java

Разделите содержимое HTML разными способами на Java. Вы можете использовать следующие режимы извлечения страниц для HTML файлов: 'разделить по заголовкам', 'разделить по разделам', 'разделить страницу за страницей', 'разделить по диапазонам страниц'.

После разделения вашего HTML файла на части вы можете экспортировать результат в нужный формат, вызвав метод 'Document.Save'. Вы также можете управлять тем, каким образом части HTML экспортируются в HTML форматы или EPUB, используя свойство 'DocumentPartSavingCallback', которое также позволит вам перенаправлять потоки вывода.

Легко разделяйте HTML документы с помощью нашего решения для Java. В следующем примере показано, как разделить HTML на Java:

Пример Java кода для разделения HTML файла
Загрузите файл, который хотите разделить
Выполнить код
Выберите целевой формат из списка
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>
Копировать
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
Копировать
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
Копировать
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
Копировать
import com.aspose.words.*;

Document doc = new Document("Input.html");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.html", page + 1));
}
Выполнить код

Как разделить HTML на части Java

  1. Установите Java библиотеку для программного разделения HTML файлов.
  2. Добавьте ссылку на библиотеку (импортируйте библиотеку) в свой Java проект.
  3. Откройте HTML на Java.
  4. Вызовите метод extractPages(), чтобы извлечь определенные страницы из HTML.
  5. Получите результат разделения HTML на отдельные файлы.

Java библиотека для разделения HTML документов

Мы размещаем наши пакеты Java в репозиториях Maven. 'Aspose.Words для Java' - это обычный JAR файл, содержащий байт-код. Следуйте пошаговым инструкциям по его установке в среде разработчика Java.

Системные Требования

Поддерживаются Java SE 7 и более поздние версии Java. Мы также предоставляем отдельный пакет для Java SE 6 на случай, если вам придется использовать эту устаревшую JRE.

Наша библиотека Java является кроссплатформенной и работает во всех операционных системах с JVM, включая Microsoft Windows, Linux, macOS, Android и iOS.

Для получения информации о дополнительных зависимостях пакетов, таких как JogAmp JOGL, Harfbuzz шрифтов Java Advanced Imaging JAI, обратитесь к документации по продукту.

Другие поддерживаемые HTML операции разделения

Вы также можете разделить HTML на файлы других форматов:

5%

Подпишитесь на обновления продукта Aspose

Получайте ежемесячные информационные бюллетени и предложения, доставляемые прямо на ваш почтовый ящик.