在 Python 中將文檔拆分為多個部分

快速 Python 庫,用於根據給定標準將文檔拆分為一組較小的文件。

使用 Python 庫將文檔拆分為多個部分。您可以將提取的頁面與其他數據集成,從而獲得所需形式和內容的文檔。將文檔拆分為多個部分可以更輕鬆地進行協作。

查看代碼片段

使用 Python 拆分 Word、PDF

該軟件庫為 Python 開發人員提供了一組功能,可將 Word、PDF、EPUB、HTML、DOCX 文檔拆分為多個部分。將文本拆分為單獨的文件可用於更輕鬆地處理文檔的各個部分。文檔拆分過程可以是用於將數據集成到自動化信息系統或數據庫中的技術的一部分。

我們的庫為 Python 開發人員提供了文檔所需的所有功能,並根據指定的模式提取文檔頁面。這是一個獨立的 Python via .NET 解決方案,不需要安裝 Microsoft Word、Acrobat Reader 或其他應用程序。

使用 Python 將文檔拆分為多個部分

在 Python 代碼中使用不同的標準拆分文檔內容。您可以使用以下頁面提取模式:"按標題拆分"、"按節拆分"、"按頁拆分"、"按頁面範圍拆分"。

拆分文檔後,您可以使用 'Document.Save' 方法將結果導出為所需的文件格式。您還可以使用 'DocumentPartSavingCallback' 屬性控制如何將文檔部分導出為 HTML 或 EPUB 格式,這將允許您重定向輸出流。

使用我們的 Python via .NET 解決方案輕鬆拆分文檔。以下示例顯示如何使用 Python:

Python 中的代碼示例,用於將文檔拆分為多個部分
上傳要拆分的文件
運行代碼
從列表中選擇目標格式
pip install aspose-words
複製
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
運行代碼

如何在Python中拆分 Word、PDF、HTML 和其他文件格式

  1. 安裝 Python 庫以編程方式拆分文檔。
  2. 將庫引用(導入庫)添加到您的 Python 項目。
  3. 在 Python 中打開源文檔。
  4. 調用extract_pages()方法從文檔中提取特定頁面。
  5. 將文檔拆分的結果作為單獨的文件獲取。

Python 用於拆分文件的庫

我們在PyPi存儲庫中託管我們的 Python 請按照有關如何 "Aspose.Words for Python via .NET" 安裝到您的開發人員環境的分步說明進行操作。

系統要求

這個包與 Python ≥3.5 和 <3.12 兼容。如果您為 Linux 開發軟件,請查看產品文檔中對 gcc 和 libpython 的附加要求。

最流行的分割文件格式

5%

訂閱 Aspose 產品更新

獲取直接發送到您的郵箱的每月通訊和優惠。

© Aspose Pty Ltd 2001-2024. 版權所有。