在 Python 中将文档拆分为多个部分

快速 Python 库,用于根据给定标准将文档拆分为一组较小的文件。

使用 Python 库将文档拆分为多个部分。您可以将提取的页面与其他数据集成,从而获得所需形式和内容的文档。将文档拆分为多个部分可以更轻松地进行协作。

查看代码片段

使用 Python 拆分 Word、PDF

该软件库为 Python 开发人员提供了一组功能,可将 Word、PDF、EPUB、HTML、DOCX 文档拆分为多个部分。将文本拆分为单独的文件可用于更轻松地处理文档的各个部分。文档拆分过程可以是用于将数据集成到自动化信息系统或数据库中的技术的一部分。

我们的库为 Python 开发人员提供了文档所需的所有功能,并根据指定的模式提取文档页面。这是一个独立的 Python via .NET 解决方案,不需要安装 Microsoft Word、Acrobat Reader 或其他应用程序。

使用 Python 将文档拆分为多个部分

在 Python 代码中使用不同的标准拆分文档内容。您可以使用以下页面提取模式:"按标题拆分"、"按节拆分"、"按页拆分"、"按页面范围拆分"。

拆分文档后,您可以使用 'Document.Save' 方法将结果导出为所需的文件格式。您还可以使用 'DocumentPartSavingCallback' 属性控制如何将文档部分导出为 HTML 或 EPUB 格式,这将允许您重定向输出流。

使用我们的 Python via .NET 解决方案轻松拆分文档。以下示例显示如何使用 Python:

Python 中用于将文档拆分为多个部分的代码示例
上传要拆分的文件
运行代码
从列表中选择目标格式
pip install aspose-words
复制
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
运行代码

如何在Python中拆分 Word、PDF、HTML 和其他文件格式

  1. 安装 Python 库以编程方式拆分文档。
  2. 将库引用(导入库)添加到您的 Python 项目。
  3. 在 Python 中打开源文档。
  4. 调用extract_pages()方法从文档中提取特定页面。
  5. 将文档拆分的结果作为单独的文件获取。

Python 用于拆分文件的库

我们在PyPi存储库中托管我们的 Python 请按照有关如何 "Aspose.Words for Python via .NET" 安装到您的开发人员环境的分步说明进行操作。

系统要求

这个包与 Python ≥3.5 和 <3.12 兼容。如果您为 Linux 开发软件,请查看产品文档中对 gcc 和 libpython 的附加要求。

最流行的分割文件格式

5%

订阅 Aspose 产品更新

获取直接发送到您的邮箱的每月通讯和优惠。

© Aspose Pty Ltd 2001-2024. 版权所有。