為什麼要在 Java 中拆分文件格式？

將文檔拆分為多個部分允許您並行處理單獨的文件。安裝 Java 庫以編程方式拆分文檔。將庫引用（導入庫）添加到您的 Java 項目。在 Java 中打開源文檔。調用extractPages()方法從文檔中提取特定頁面。將文檔拆分的結果作為單獨的文件獲取。

我可以使用您的 Java 庫拆分哪些文件格式？

您可以將源文檔拆分為多個部分並將它們保存為多種文件格式：DOCX、PDF、ODT、DOC、HTML、RTF、Markdown、WPS、TXT 等等。

此 Java 庫支持的最大文件大小是多少？

使用此 Java 庫拆分文件沒有大小限制。

在 Java 中將 Word、PDF、HTML 文檔拆分為單獨的文件

Q: 為什麼要在 Java 中拆分文件格式？

將文檔拆分為多個部分允許您並行處理單獨的文件。 安裝 Java 庫以編程方式拆分文檔。 將庫引用（導入庫）添加到您的 Java 項目。 在 Java 中打開源文檔。 調用extractPages()方法從文檔中提取特定頁面。 將文檔拆分的結果作為單獨的文件獲取。

在 Java 中將文檔拆分為多個部分

快速 Java 庫，用於根據給定標準將文檔拆分為一組較小的文件。

使用 Java 庫將文檔拆分為多個部分。您可以將提取的頁面與其他數據集成，從而獲得所需形式和內容的文檔。將文檔拆分為多個部分可以更輕鬆地進行協作。

使用 Java 拆分 Word、PDF

該軟件庫為 Java 開發人員提供了一組功能，可將 Word、PDF、EPUB、HTML、DOCX 文檔拆分為多個部分。將文本拆分為單獨的文件可用於更輕鬆地處理文檔的各個部分。文檔拆分過程可以是用於將數據集成到自動化信息系統或數據庫中的技術的一部分。

我們的庫為 Java 開發人員提供了文檔所需的所有功能，並根據指定的模式提取文檔頁面。這是一個獨立的 Java 解決方案，不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。

使用 Java 將文檔拆分為多個部分

在 Java 代碼中使用不同的標準拆分文檔內容。您可以使用以下頁面提取模式："按標題拆分"、"按節拆分"、"按頁拆分"、"按頁面範圍拆分"。

拆分文檔後，您可以使用 'Document.Save' 方法將結果導出為所需的文件格式。您還可以使用 'DocumentPartSavingCallback' 屬性控制如何將文檔部分導出為 HTML 或 EPUB 格式，這將允許您重定向輸出流。

使用我們的 Java 解決方案輕鬆拆分文檔。以下示例顯示如何使用 Java:

Java 中的代碼示例，用於將文檔拆分為多個部分

輸入文件

上傳要拆分的文件

運行代碼

輸出格式

從列表中選擇目標格式

// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>

複製

// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')

複製

// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>

複製

// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"

複製

import com.aspose.words.*;

Document doc = new Document("Input.docx");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.docx", page + 1));
}
            

					運行代碼
				

您可以自由複制此代碼並將其用於任何適用目的

如何在Java中拆分 Word、PDF、HTML 和其他文件格式

安裝 Java 庫以編程方式拆分文檔。
將庫引用（導入庫）添加到您的 Java 項目。
在 Java 中打開源文檔。
調用extractPages()方法從文檔中提取特定頁面。
將文檔拆分的結果作為單獨的文件獲取。

Java 用於拆分文件的庫

我們在Maven存儲庫中託管我們的 Java 'Aspose.Words for Java' 是一個常見的包含字節碼的 JAR 請按照有關如何將其安裝到 Java 開發人員環境的分步說明進行操作。

系統要求

Java SE 7 和更新的 Java 版本。 Java SE 6 提供了一個單獨的包，以防您不得不使用這個過時的 JRE 。

我們的 Java 包是跨平台的，可以在所有具有 JVM 實現的 Microsoft Windows 、Linux、macOS、Android 和 iOS。

有關可選包依賴項的信息，例如 JogAmp JOGL 、 Harfbuzz 字體引擎、 Java Advanced Imaging JAI ，請參閱產品文檔。

DOCX

TXT

WORD