为什么要在 Java 中拆分文件格式？

将文档拆分为多个部分允许您并行处理单独的文件。安装 Java 库以编程方式拆分文档。将库引用（导入库）添加到您的 Java 项目。在 Java 中打开源文档。调用extractPages()方法从文档中提取特定页面。将文档拆分的结果作为单独的文件获取。

我可以使用您的 Java 库拆分哪些文件格式？

您可以将源文档拆分为多个部分并将它们保存为多种文件格式：DOCX、PDF、ODT、DOC、HTML、RTF、Markdown、WPS、TXT 等等。

此 Java 库支持的最大文件大小是多少？

使用此 Java 库拆分文件没有大小限制。

在 Java 中将 Word、PDF、HTML 文档拆分为单独的文件

Q: 为什么要在 Java 中拆分文件格式？

将文档拆分为多个部分允许您并行处理单独的文件。 安装 Java 库以编程方式拆分文档。 将库引用（导入库）添加到您的 Java 项目。 在 Java 中打开源文档。 调用extractPages()方法从文档中提取特定页面。 将文档拆分的结果作为单独的文件获取。

在 Java 中将文档拆分为多个部分

快速 Java 库，用于根据给定标准将文档拆分为一组较小的文件。

使用 Java 库将文档拆分为多个部分。您可以将提取的页面与其他数据集成，从而获得所需形式和内容的文档。将文档拆分为多个部分可以更轻松地进行协作。

使用 Java 拆分 Word、PDF

该软件库为 Java 开发人员提供了一组功能，可将 Word、PDF、EPUB、HTML、DOCX 文档拆分为多个部分。将文本拆分为单独的文件可用于更轻松地处理文档的各个部分。文档拆分过程可以是用于将数据集成到自动化信息系统或数据库中的技术的一部分。

我们的库为 Java 开发人员提供了文档所需的所有功能，并根据指定的模式提取文档页面。这是一个独立的 Java 解决方案，不需要安装 Microsoft Word、Acrobat Reader 或其他应用程序。

使用 Java 将文档拆分为多个部分

在 Java 代码中使用不同的标准拆分文档内容。您可以使用以下页面提取模式："按标题拆分"、"按节拆分"、"按页拆分"、"按页面范围拆分"。

拆分文档后，您可以使用 'Document.Save' 方法将结果导出为所需的文件格式。您还可以使用 'DocumentPartSavingCallback' 属性控制如何将文档部分导出为 HTML 或 EPUB 格式，这将允许您重定向输出流。

使用我们的 Java 解决方案轻松拆分文档。以下示例显示如何使用 Java:

Java 中用于将文档拆分为多个部分的代码示例

输入文件

上传要拆分的文件

运行代码

输出格式

从列表中选择目标格式

// Repository path: https://releases.aspose.com/java/repo/
// Maven, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>ver</version>
  <classifier>jdk17</classifier>
</dependency>

复制

// Repository path: https://releases.aspose.com/java/repo/
// Gradle, where 'ver' - Aspose.Words version number, for example, 24.4.
compile(group: 'com.aspose', name: 'aspose-words', version: 'ver', classifier: 'jdk17')

复制

// Repository path: https://releases.aspose.com/java/repo/
// Ivy, where 'ver' - Aspose.Words version number, for example, 24.4.
<dependency org="com.aspose" name="aspose-words" rev="ver">
 <artifact name="aspose-words" m:classifier="jdk17" ext="jar"/>
</dependency>

复制

// Repository path: https://releases.aspose.com/java/repo/
// Sbt, where 'ver' - Aspose.Words version number, for example, 24.4.
libraryDependencies += "com.aspose" % "aspose-words" % "ver"

复制

import com.aspose.words.*;

Document doc = new Document("Input.docx");

for (int page = 0; page < doc.getPageCount(); page++)
{
    Document extractedPage = doc.extractPages(page, 1);
    extractedPage.save(String.format("Output_%d.docx", page + 1));
}
            

					运行代码
				

您可以自由复制此代码并将其用于任何适用目的

如何在Java中拆分 Word、PDF、HTML 和其他文件格式

安装 Java 库以编程方式拆分文档。
将库引用（导入库）添加到您的 Java 项目。
在 Java 中打开源文档。
调用extractPages()方法从文档中提取特定页面。
将文档拆分的结果作为单独的文件获取。

Java 用于拆分文件的库

我们在Maven存储库中托管我们的 Java 'Aspose.Words for Java' 是一个常见的包含字节码的 JAR 请按照有关如何将其安装到 Java 开发人员环境的分步说明进行操作。

系统要求

Java SE 7 和更新的 Java 版本。 Java SE 6 提供了一个单独的包，以防您不得不使用这个过时的 JRE 。

我们的 Java 包是跨平台的，可以在所有具有 JVM 实现的 Microsoft Windows 、Linux、macOS、Android 和 iOS。

有关可选包依赖项的信息，例如 JogAmp JOGL 、 Harfbuzz 字体引擎、 Java Advanced Imaging JAI ，请参阅产品文档。

DOCX

TXT

WORD