Разделете документите на части в Python

Бърза Python библиотека за разделяне на документ на група от по-малки файлове според дадените критерии

Използвайте Python библиотека, за да разделите документи на части. Можете да интегрирате извлечените страници с други данни и в резултат на това да получите документи с формата и съдържанието, от които се нуждаете. Разделянето на документи на части улеснява съвместната работа по тях.

Вижте кодовия фрагмент

Разделете Word, PDF с помощта на Python

Тази софтуерна библиотека предоставя на разработчиците на Python набор от функции за разделяне на Word, PDF, EPUB, HTML, DOCX документи на части. Разделянето на текст на отделни файлове може да се използва за улесняване на работата с раздели от документи. Процедурата по разделяне на документи може да бъде част от технологията за интегриране на данни в автоматизирани информационни системи или бази данни.

Нашата библиотека предоставя на разработчиците на Python всички необходими функции за документи и извличане на страници от документи според посочения режим. Това е самостоятелно решение Python via .NET, което не изисква инсталирани Microsoft Word, Acrobat Reader или други приложения.

Разделете документ на части с помощта на Python

Разделете съдържанието на документа, като използвате различни критерии в кода Python. Можете да използвате следните режими на извличане на страници: "разделяне по заглавия", "разделяне по секции", "разделяне на страница по страница", "разделяне по диапазони на страници".

След като разделите документа, можете да експортирате резултата в необходимия файлов формат, като използвате метода 'Document.Save'. Можете също да контролирате как частите на документа се експортират в HTML или EPUB формати, като използвате свойството 'DocumentPartSavingCallback', което ще ви позволи да пренасочвате изходни потоци.

Разделяйте лесно документи с нашето решение за Python via .NET. Следният пример показва как да разделите документ с помощта на Python:

Пример за код в Python за разделяне на документи на части
Качете файл, който искате да разделите
Изпълнение на код
Изберете целевия формат от списъка
pip install aspose-words
копие
import aspose.words as aw

doc = aw.Document("Input.docx")
            
for page in range(0, doc.page_count):
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"Output_{page + 1}.docx")
Изпълнение на код

Как да разделите Word, PDF, HTML и други файлови формати в Python

  1. Инсталирайте Python библиотека, за да разделите документите програмно.
  2. Добавете препратка към библиотеката (импортирайте библиотеката) към вашия Python проект.
  3. Отворете изходния документ в Python.
  4. Извикайте метода extract_pages(), за да извлечете конкретни страници от вашия документ.
  5. Получете резултата от разделянето на документа като отделни файлове.

Python библиотека за разделяне на файлове

Ние хостваме нашите Python пакети в хранилища на PyPi. Моля, следвайте инструкциите стъпка по стъпка как да инсталирате "Aspose.Words for Python via .NET" във вашата среда за разработчици.

Системни изисквания

Този пакет е съвместим с Python ≥3.5 и <3.12. Ако разработвате софтуер за Linux, моля, разгледайте допълнителните изисквания за gcc и libpython в продуктовата документация.

Най-популярните файлови формати за разделяне

5%

Абонирайте се за актуализации на продуктите на Aspose

Получавайте месечни бюлетини и оферти директно до вашата пощенска кутия.

© Aspose Pty Ltd 2001-2024. Всички права запазени.