Используйте Java библиотеку для разделения HTML файлов на части. Вы можете интегрировать извлеченные HTML страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение HTML на части упрощает совместную работу над HTML файлами.
Эта программная библиотека предоставляет Java разработчикам набор функций для разделения HTML файлов на части. Разделение HTML на отдельные файлы может использоваться для распараллеливания работы с разделами документа. Например, если над одним HTML документом работают несколько человек одновременно, то разделение HTML позволит им ускорить работу. Разделение HTML может быть частью технологии извлечения текста из HTML файлов и интеграции данных в автоматизированные информационные системы или базы данных.
Java библиотека предоставляет разработчикам все необходимые функции для разделения HTML на части и извлечения страниц в соответствии с заданным режимом. Это автономное решение для Java, которое не требует установки офисных пакетов Microsoft Word, Acrobat Reader или других приложений.
Разделите содержимое HTML разными способами на Java. Вы можете использовать следующие режимы извлечения страниц для HTML файлов: 'разделить по заголовкам', 'разделить по разделам', 'разделить страницу за страницей', 'разделить по диапазонам страниц'.
После разделения вашего HTML файла на части вы можете экспортировать результат в нужный формат, вызвав метод 'Document.Save'. Вы также можете управлять тем, каким образом части HTML экспортируются в HTML форматы или EPUB, используя свойство 'DocumentPartSavingCallback', которое также позволит вам перенаправлять потоки вывода.
Легко разделяйте HTML документы с помощью нашего решения для Java. В следующем примере показано, как разделить HTML на Java:
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>ver</version>
<classifier>jdk17</classifier>
</dependency>
Копировать
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
Копировать
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
<artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
Копировать
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
Копировать
import com.aspose.words.*;
Document doc = new Document("Input.html");
for (int page = 0; page < doc.getPageCount(); page++)
{
Document extractedPage = doc.extractPages(page, 1);
extractedPage.save(String.format("Output_%d.html", page + 1));
}
Мы размещаем наши пакеты Java в репозиториях Maven. 'Aspose.Words для Java' - это обычный JAR файл, содержащий байт-код. Следуйте пошаговым инструкциям по его установке в среде разработчика Java.
Поддерживаются Java SE 7 и более поздние версии Java. Мы также предоставляем отдельный пакет для Java SE 6 на случай, если вам придется использовать эту устаревшую JRE.
Наша библиотека Java является кроссплатформенной и работает во всех операционных системах с JVM, включая Microsoft Windows, Linux, macOS, Android и iOS.
Для получения информации о дополнительных зависимостях пакетов, таких как JogAmp JOGL, Harfbuzz шрифтов Java Advanced Imaging JAI, обратитесь к документации по продукту.