該軟件庫為 Python 開發人員提供了一組將 DOCX 文件拆分為多個部分的函數。將 DOCX 文檔拆分為單獨的文件可以更輕鬆地並行處理文檔的各個部分。例如,如果幾個人同時處理一個 DOCX 文檔,則拆分該文檔將使他們能夠加快工作速度。 DOCX 文檔分割可以是從 DOCX 文件中提取文本並將數據集成到自動化信息系統或數據庫中的技術的一部分。
我們的庫為 Python 開發人員提供了將 DOCX 文件拆分為多個部分並根據指定模式提取頁面的所有必要功能。這是一個獨立的 Python via .NET 解決方案,不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。
在 Python 代碼中使用不同的標準拆分 DOCX 內容。您可以對 DOCX 文檔使用以下頁面提取模式:"按標題拆分"、"按部分拆分"、"逐頁拆分"、"按頁面範圍拆分"。
將 DOCX 文件拆分為多個部分後,您可以使用"Document.Save"方法將結果導出為所需的文件格式。您還可以使用"DocumentPartSavingCallback"屬性控制如何將 DOCX 文檔部分導出為 HTML 或 EPUB,這將允許您重定向輸出流。
使用我們的 Python via .NET 解決方案輕鬆拆分 DOCX 文檔。以下示例顯示如何使用 Python 拆分 DOCX 文檔:
pip install aspose-words
複製
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
我們在PyPi存儲庫中託管我們的 Python 請按照有關如何 "Aspose.Words for Python via .NET" 安裝到您的開發人員環境的分步說明進行操作。
這個包與 Python ≥3.5 和 <3.12 兼容。如果您為 Linux 開發軟件,請查看產品文檔中對 gcc 和 libpython 的附加要求。