Chia DOCX thành các phần trong Python

Thư viện Python nhanh chóng để chia một DOCX tệp thành một nhóm tệp nhỏ hơn theo tiêu chí đã cho

Sử dụng thư viện Python via .NET để chia DOCX tệp thành nhiều phần. Bạn có thể tích hợp các trang DOCX được trích xuất với dữ liệu khác và kết quả là bạn nhận được các tài liệu có dạng và nội dung mà bạn yêu cầu. Việc chia nhỏ DOCX thành các phần giúp cộng tác trên các DOCX tệp dễ dàng hơn.

Xem đoạn mã

Tách DOCX trong Python

Thư viện phần mềm này cung cấp cho các nhà phát triển Python một bộ chức năng để chia các DOCX tệp thành nhiều phần. Có thể sử dụng việc chia DOCX tài liệu thành các tệp riêng biệt để làm việc song song với các phần của tài liệu dễ dàng hơn. Ví dụ: nếu nhiều người đang làm việc trên một DOCX tài liệu cùng lúc, việc chia nhỏ tài liệu sẽ cho phép họ tăng tốc công việc. Việc chia nhỏ DOCX tài liệu có thể là một phần của công nghệ trích xuất văn bản từ các DOCX tệp và tích hợp dữ liệu vào các hệ thống thông tin hoặc cơ sở dữ liệu tự động.

Thư viện của chúng tôi cung cấp cho các nhà phát triển Python tất cả các chức năng cần thiết để chia DOCX tệp thành nhiều phần và trích xuất các trang theo chế độ đã chỉ định. Đây là giải pháp Python via .NET độc lập không cần cài đặt Microsoft Word, Acrobat Reader hoặc các ứng dụng khác.

Chia DOCX tài liệu thành nhiều phần bằng Python

Phân tách nội dung DOCX bằng các tiêu chí khác nhau trong mã Python. Bạn có thể sử dụng các chế độ trích xuất trang sau cho DOCX tài liệu: 'chia theo tiêu đề', 'chia theo phần', 'chia trang theo trang', 'chia theo phạm vi trang'.

Sau khi chia tệp DOCX của bạn thành nhiều phần, bạn có thể xuất kết quả sang định dạng tệp được yêu cầu bằng phương pháp 'Document.Save'. Bạn cũng có thể kiểm soát cách xuất các phần tài liệu DOCX sang HTML hoặc EPUB bằng thuộc tính 'DocumentPartSavingCallback', thuộc tính này sẽ cho phép bạn chuyển hướng các luồng đầu ra.

Dễ dàng phân tách DOCX tài liệu bằng giải pháp của chúng tôi dành cho Python via .NET. Ví dụ sau đây cho thấy cách phân chia DOCX tài liệu bằng Python:

Ví dụ về mã Python để tách một DOCX tệp
Tải lên tệp bạn muốn tách
Mã vận hành
Chọn định dạng mục tiêu từ danh sách
pip install aspose-words
Sao chép
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Mã vận hành

Cách tách DOCX trong Python

  1. Cài đặt thư viện Python để tách DOCX tệp theo chương trình.
  2. Thêm tham chiếu thư viện (nhập thư viện) vào dự án Python của bạn.
  3. Mở DOCX trong Python.
  4. Gọi phương thức extract_pages() để trích xuất các trang cụ thể từ DOCX.
  5. Nhận kết quả của việc chia tách DOCX thành các tệp riêng biệt.

Python thư viện để chia nhỏ DOCX tài liệu

Chúng tôi lưu trữ các gói Python trong kho lưu trữ PyPi. Vui lòng làm theo hướng dẫn từng bước về cách cài đặt "Aspose.Words for Python via .NET" vào môi trường nhà phát triển của bạn.

yêu cầu hệ thống

Gói này tương thích với Python ≥3.5 và <3.12. Nếu bạn phát triển phần mềm cho Linux, vui lòng xem các yêu cầu bổ sung đối với gcc và libpython trong Tài liệu sản phẩm.

Các hoạt động tách DOCX được hỗ trợ khác

Bạn cũng có thể chia DOCX thành các định dạng tệp khác:

5%

Đăng ký cập nhật sản phẩm của Aspose

Nhận bản tin hàng tháng và ưu đãi gửi trực tiếp đến hộp thư của bạn.

© Aspose Pty Ltd 2001-2024. Đã đăng ký Bản quyền.