Použijte knihovnu Java k rozdělení HTML souborů na části. Extrahované stránky HTML můžete integrovat s jinými daty a v důsledku toho získat dokumenty ve formě a obsahu, které požadujete. Rozdělení HTML na části usnadňuje spolupráci na HTML souborech.
Tato softwarová knihovna poskytuje vývojářům Java sadu funkcí pro rozdělení HTML souborů na části. Rozdělení HTML do samostatných souborů lze použít k usnadnění paralelní práce s částmi dokumentu. Pokud například na jednom HTML pracuje několik lidí současně, rozdělení HTML jim umožní urychlit práci. Rozdělení HTML může být součástí technologie pro extrakci textu ze HTML souborů a integraci dat do automatizovaných informačních systémů nebo databází.
Naše knihovna poskytuje vývojářům Java všechny potřebné funkce k rozdělení HTML na části a extrahování stránek podle zadaného režimu. Toto je samostatné řešení Java, které nevyžaduje instalaci aplikací Microsoft Word, Acrobat Reader nebo jiné aplikace.
Rozdělte obsah HTML pomocí různých kritérií v Java kódu. Pro HTML soubory můžete použít následující režimy extrakce stránky: 'rozdělit podle nadpisů', 'rozdělit podle sekcí', 'rozdělit stránku po stránce', 'rozdělit podle rozsahů stránek'.
Po rozdělení HTML souboru na části můžete výsledek exportovat do požadovaného formátu souboru pomocí metody 'Document.Save'. Můžete také ovládat, jak se části HTML exportují do HTML nebo EPUB pomocí vlastnosti 'DocumentPartSavingCallback', která vám umožní přesměrovat výstupní proudy.
Rozdělte HTML dokumenty snadno pomocí našeho řešení pro Java. Následující příklad ukazuje, jak rozdělit HTML pomocí Java:
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>ver</version>
<classifier>jdk17</classifier>
</dependency>
Kopírovat
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
Kopírovat
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
<artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
Kopírovat
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
Kopírovat
import com.aspose.words.*;
Document doc = new Document("Input.html");
for (int page = 0; page < doc.getPageCount(); page++)
{
Document extractedPage = doc.extractPages(page, 1);
extractedPage.save(String.format("Output_%d.html", page + 1));
}
Naše balíčky Java hostujeme v úložištích Maven. 'Aspose.Words for Java' je běžný JAR obsahující bajtový kód. Postupujte prosím podle pokynů krok za krokem, jak jej nainstalovat do vašeho vývojářského prostředí Java.
Podporována je Java SE 7 a novější Java Poskytujeme také samostatný balíček pro Java SE 6 pro případ, že jste povinni používat toto zastaralé JRE.
Náš Java je multiplatformní a běží na všech operačních systémech s JVM, včetně Microsoft Windows, Linux, macOS, Android a iOS.
Informace o volitelných závislostech balíčků, jako je JogAmp JOGL, Harfbuzz písem Java Advanced Imaging JAI, naleznete v dokumentaci produktu.