Използвайте Python via .NET библиотека, за да разделите DOC файлове на части. Можете да интегрирате извлечените DOC страници с други данни и в резултат на това да получите документи с формата и съдържанието, от които се нуждаете. Разделянето на DOC на части улеснява съвместната работа върху DOC файлове.
Тази софтуерна библиотека предоставя на Python разработчиците набор от функции за разделяне на DOC файлове на части. Разделянето на DOC документ на отделни файлове може да се използва за улесняване на паралелната работа със секции от документ. Например, ако няколко души работят върху един DOC документ едновременно, разделянето му ще им позволи да ускорят работата. Разделянето на DOC документи може да е част от технология за извличане на текст от DOC файлове и интегриране на данни в автоматизирани информационни системи или бази данни.
Нашата библиотека предоставя на Python разработчиците всички необходими функции за разделяне на DOC файлове на части и извличане на страници според определения режим. Това е самостоятелно решение Python via .NET, което не се нуждае от инсталиране на Microsoft Word, Acrobat Reader или други приложения.
Разделете DOC съдържание, като използвате различни критерии в Python код. Можете да използвате следните режими за извличане на страници за DOC документи: "разделяне по заглавия", "разделяне по секции", "разделяне на страница по страница", "разделяне по диапазони от страници".
След като разделите вашия DOC файл на части, можете да експортирате резултата в необходимия файлов формат с помощта на метода "Document.Save". Можете също така да контролирате как частите на документа DOC се експортират в HTML или EPUB, като използвате свойството "DocumentPartSavingCallback", което ще ви позволи да пренасочвате изходните потоци.
Лесно разделяне на DOC документи с нашето решение за Python via .NET. Следващият пример показва как да разделите DOC документ с помощта на Python:
pip install aspose-words
копие
import aspose.words as aw
doc = aw.Document("Input.doc")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.doc")
Ние хостваме нашите Python пакети в хранилища на PyPi. Моля, следвайте инструкциите стъпка по стъпка как да инсталирате "Aspose.Words for Python via .NET" във вашата среда за разработчици.
Този пакет е съвместим с Python ≥3.5 и <3.12. Ако разработвате софтуер за Linux, моля, разгледайте допълнителните изисквания за gcc и libpython в продуктовата документация.