Используйте Python via .NET библиотеку для разделения DOCX файлов на части. Вы можете интегрировать извлеченные DOCX страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение DOCX на части упрощает совместную работу над DOCX файлами.
Эта программная библиотека предоставляет разработчикам Python набор функций для разделения DOCX файлов на части. Разделение DOCX документа на отдельные файлы можно использовать для упрощения параллельной работы с разделами документа. Например, если над одним DOCX документом одновременно работают несколько человек, его разделение позволит им ускорить работу. Разделение DOCX документов может быть частью технологии извлечения текста из DOCX файлов и интеграции данных в автоматизированные информационные системы или базы данных.
Наша библиотека предоставляет разработчикам Python все необходимые функции для разделения DOCX файлов на части и извлечения страниц в соответствии с заданным режимом. Это автономное решение Python via .NET, для которого не требуется установка Microsoft Word, Acrobat Reader или других приложений.
Разделите содержимое DOCX, используя разные критерии в коде Python. Вы можете использовать следующие режимы извлечения страниц для DOCX документов: "разделить по заголовкам", "разделить по разделам", "разделить по страницам", "разделить по диапазонам страниц".
После разделения файла DOCX на части вы можете экспортировать результат в необходимый формат файла с помощью метода Document.Save. Вы также можете контролировать, как части документа DOCX экспортируются в HTML или EPUB, используя свойство DocumentPartSavingCallback, которое позволит вам перенаправлять выходные потоки.
Легко разделяйте DOCX документы с помощью нашего решения для Python via .NET. В следующем примере показано, как разделить DOCX документ с помощью Python:
pip install aspose-words
Копировать
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
Мы размещаем наши пакеты Python в репозиториях PyPi. Следуйте пошаговым инструкциям по установке "Aspose.Words for Python via .NET" в среду разработчика.
Этот пакет совместим с Python ≥3.5 и <3.12. Если вы разрабатываете программное обеспечение для Linux, ознакомьтесь с дополнительными требованиями для gcc и libpython в документации по продукту.