Разделить документы на части, используя Python

Быстрая Python библиотека для разделения документа на группу файлов меньшего размера в соответствии с заданными критериями

Используйте Python библиотеку для разделения документов на части. Вы можете интегрировать извлеченные страницы с другими данными и в результате получить документы нужной вам формы и содержания. Разделение документов на части упрощает совместную работу над ними.

Посмотреть фрагмент кода

Разделить Word, PDF на Python

Эта программная библиотека предоставляет Python разработчикам набор функций для разделения Word документов, PDF, EPUB, HTML, DOCX на части. Деление текста на отдельные файлы может использоваться для облегчения работы с разделами документа. Процедура разделения документов может быть частью технологии интеграции полученных данных в автоматизированные информационные системы или БД.

Python библиотека предоставляет разработчикам все необходимые функции для извлечения страниц документов в соответствии с заданным режимом. Это автономное решение для Python via .NET, которое не требует установки офисных пакетов Microsoft Word, Acrobat Reader или других приложений.

Разделить документ на части, используя Python

Разделите содержимое документа различными способами на Python. Вы можете использовать следующие режимы извлечения страниц: 'разбить по заголовкам', 'разбить по разделам', 'разбить страницу за страницей', 'разбить по диапазонам страниц'.

После разделения документа вы можете экспортировать результат в нужный файловый формат, вызвав метод 'Document.Save'. Вы можете управлять тем, каким образом части документа экспортируются в HTML форматы или EPUB, используя свойство 'DocumentPartSavingCallback', которое также позволит вам перенаправить потоки вывода.

Легко разделяйте документы с помощью нашего решения для Python via .NET. В следующем примере показано, как разделить документ на Python:

Пример кода на Python для разделения документов на части
Загрузите файл, который хотите разделить
Выполнить код
Выберите целевой формат из списка
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Выполнить код

Как разделить документ на части Python: Word, PDF, JPG

  1. Установите Python библиотеку для программного разделения документов.
  2. Добавьте ссылку на библиотеку (импортируйте библиотеку) в свой Python проект.
  3. Откройте исходный документ на Python.
  4. Вызовите метод extract_pages(), чтобы извлечь определенные страницы из вашего документа.
  5. Получите результат разбиения документа на отдельные файлы.

Python библиотека для разделения файлов

Мы размещаем наши пакеты Python в репозиториях PyPi. Следуйте пошаговым инструкциям по установке "Aspose.Words for Python via .NET" в среду разработчика.

Системные Требования

Этот пакет совместим с Python ≥3.5 и <3.12. Если вы разрабатываете программное обеспечение для Linux, ознакомьтесь с дополнительными требованиями для gcc и libpython в документации по продукту.

Самые популярные форматы файлов для разделения

5%

Подпишитесь на обновления продукта Aspose

Получайте ежемесячные информационные бюллетени и предложения, доставляемые прямо на ваш почтовый ящик.