Разделить DOCX на части, используя Python

Быстрая Python библиотека для разделения одного DOCX файла на группу файлов меньшего размера в соответствии с заданными критериями

Используйте Python via .NET библиотеку для разделения DOCX файлов на части. Вы можете интегрировать извлеченные DOCX страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение DOCX на части упрощает совместную работу над DOCX файлами.

Посмотреть фрагмент кода

Разделить DOCX в Python

Эта программная библиотека предоставляет разработчикам Python набор функций для разделения DOCX файлов на части. Разделение DOCX документа на отдельные файлы можно использовать для упрощения параллельной работы с разделами документа. Например, если над одним DOCX документом одновременно работают несколько человек, его разделение позволит им ускорить работу. Разделение DOCX документов может быть частью технологии извлечения текста из DOCX файлов и интеграции данных в автоматизированные информационные системы или базы данных.

Наша библиотека предоставляет разработчикам Python все необходимые функции для разделения DOCX файлов на части и извлечения страниц в соответствии с заданным режимом. Это автономное решение Python via .NET, для которого не требуется установка Microsoft Word, Acrobat Reader или других приложений.

Разделите DOCX документ на части, используя Python.

Разделите содержимое DOCX, используя разные критерии в коде Python. Вы можете использовать следующие режимы извлечения страниц для DOCX документов: "разделить по заголовкам", "разделить по разделам", "разделить по страницам", "разделить по диапазонам страниц".

После разделения файла DOCX на части вы можете экспортировать результат в необходимый формат файла с помощью метода Document.Save. Вы также можете контролировать, как части документа DOCX экспортируются в HTML или EPUB, используя свойство DocumentPartSavingCallback, которое позволит вам перенаправлять выходные потоки.

Легко разделяйте DOCX документы с помощью нашего решения для Python via .NET. В следующем примере показано, как разделить DOCX документ с помощью Python:

Пример Python кода для разделения DOCX файла
Загрузите файл, который хотите разделить
Выполнить код
Выберите целевой формат из списка
pip install aspose-words
Копировать
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Выполнить код

Как разделить DOCX на части Python

  1. Установите Python библиотеку для программного разделения DOCX файлов.
  2. Добавьте ссылку на библиотеку (импортируйте библиотеку) в свой Python проект.
  3. Откройте DOCX на Python.
  4. Вызовите метод extract_pages(), чтобы извлечь определенные страницы из DOCX.
  5. Получите результат разделения DOCX на отдельные файлы.

Python библиотека для разделения DOCX документов

Мы размещаем наши пакеты Python в репозиториях PyPi. Следуйте пошаговым инструкциям по установке "Aspose.Words for Python via .NET" в среду разработчика.

Системные Требования

Этот пакет совместим с Python ≥3.5 и <3.12. Если вы разрабатываете программное обеспечение для Linux, ознакомьтесь с дополнительными требованиями для gcc и libpython в документации по продукту.

Другие поддерживаемые DOCX операции разделения

Вы также можете разделить DOCX на файлы других форматов:

5%

Подпишитесь на обновления продукта Aspose

Получайте ежемесячные информационные бюллетени и предложения, доставляемые прямо на ваш почтовый ящик.