該軟件庫為 Java 開發人員提供了一組功能,可將 Word、PDF、EPUB、HTML、DOCX 文檔拆分為多個部分。將文本拆分為單獨的文件可用於更輕鬆地處理文檔的各個部分。文檔拆分過程可以是用於將數據集成到自動化信息系統或數據庫中的技術的一部分。
我們的庫為 Java 開發人員提供了文檔所需的所有功能,並根據指定的模式提取文檔頁面。這是一個獨立的 Java 解決方案,不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。
在 Java 代碼中使用不同的標準拆分文檔內容。您可以使用以下頁面提取模式:"按標題拆分"、"按節拆分"、"按頁拆分"、"按頁面範圍拆分"。
拆分文檔後,您可以使用 'Document.Save' 方法將結果導出為所需的文件格式。您還可以使用 'DocumentPartSavingCallback' 屬性控制如何將文檔部分導出為 HTML 或 EPUB 格式,這將允許您重定向輸出流。
使用我們的 Java 解決方案輕鬆拆分文檔。以下示例顯示如何使用 Java:
// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>ver</version>
<classifier>jdk17</classifier>
</dependency>
複製
// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')
複製
// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
<artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>
複製
// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"
複製
import com.aspose.words.*;
Document doc = new Document("Input.docx");
for (int page = 0; page < doc.getPageCount(); page++)
{
Document extractedPage = doc.extractPages(page, 1);
extractedPage.save(String.format("Output_%d.docx", page + 1));
}
我們在Maven存儲庫中託管我們的 Java 'Aspose.Words for Java' 是一個常見的包含字節碼的 JAR 請按照有關如何將其安裝到 Java 開發人員環境的分步說明進行操作。
Java SE 7 和更新的 Java 版本。 Java SE 6 提供了一個單獨的包,以防您不得不使用這個過時的 JRE 。
我們的 Java 包是跨平台的,可以在所有具有 JVM 實現的 Microsoft Windows 、Linux、macOS、Android 和 iOS。
有關可選包依賴項的信息,例如 JogAmp JOGL 、 Harfbuzz 字體引擎、 Java Advanced Imaging JAI ,請參閱產品文檔。