Используйте Python библиотеку для разделения документов на части. Вы можете интегрировать извлеченные страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение документов на части упрощает совместную работу над ними.
Эта программная библиотека предоставляет Python разработчикам набор функций для разделения Word документов, PDF, EPUB, HTML, DOCX на части. Деление текста на отдельные файлы может использоваться для облегчения работы с разделами документа. Процедура разделения документов может быть частью технологии интеграции полученных данных в автоматизированные информационные системы или БД.
Python библиотека предоставляет разработчикам все необходимые функции для извлечения страниц документов в соответствии с заданным режимом. Это автономное решение для Python via .NET, которое не требует установки офисных пакетов Microsoft Word, Acrobat Reader или других приложений.
Разделите содержимое документа различными способами на Python. Вы можете использовать следующие режимы извлечения страниц: 'разбить по заголовкам', 'разбить по разделам', 'разбить страницу за страницей', 'разбить по диапазонам страниц'.
После разделения документа вы можете экспортировать результат в нужный файловый формат, вызвав метод 'Document.Save'. Вы можете управлять тем, каким образом части документа экспортируются в HTML форматы или EPUB, используя свойство 'DocumentPartSavingCallback', которое также позволит вам перенаправить потоки вывода.
Легко разделяйте документы с помощью нашего решения для Python via .NET. В следующем примере показано, как разделить документ на Python:
pip install aspose-words
Копировать
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
Мы размещаем наши пакеты Python в репозиториях PyPi. Следуйте пошаговым инструкциям по установке "Aspose.Words for Python via .NET" в среду разработчика.
Этот пакет совместим с Python ≥3.5 и <3.12. Если вы разрабатываете программное обеспечение для Linux, ознакомьтесь с дополнительными требованиями для gcc и libpython в документации по продукту.