Използвайте Python via .NET библиотека, за да разделите DOCX файлове на части. Можете да интегрирате извлечените DOCX страници с други данни и в резултат на това да получите документи с формата и съдържанието, от които се нуждаете. Разделянето на DOCX на части улеснява съвместната работа върху DOCX файлове.
Тази софтуерна библиотека предоставя на Python разработчиците набор от функции за разделяне на DOCX файлове на части. Разделянето на DOCX документ на отделни файлове може да се използва за улесняване на паралелната работа със секции от документ. Например, ако няколко души работят върху един DOCX документ едновременно, разделянето му ще им позволи да ускорят работата. Разделянето на DOCX документи може да е част от технология за извличане на текст от DOCX файлове и интегриране на данни в автоматизирани информационни системи или бази данни.
Нашата библиотека предоставя на Python разработчиците всички необходими функции за разделяне на DOCX файлове на части и извличане на страници според определения режим. Това е самостоятелно решение Python via .NET, което не се нуждае от инсталиране на Microsoft Word, Acrobat Reader или други приложения.
Разделете DOCX съдържание, като използвате различни критерии в Python код. Можете да използвате следните режими за извличане на страници за DOCX документи: "разделяне по заглавия", "разделяне по секции", "разделяне на страница по страница", "разделяне по диапазони от страници".
След като разделите вашия DOCX файл на части, можете да експортирате резултата в необходимия файлов формат с помощта на метода "Document.Save". Можете също така да контролирате как частите на документа DOCX се експортират в HTML или EPUB, като използвате свойството "DocumentPartSavingCallback", което ще ви позволи да пренасочвате изходните потоци.
Лесно разделяне на DOCX документи с нашето решение за Python via .NET. Следващият пример показва как да разделите DOCX документ с помощта на Python:
pip install aspose-words
копие
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
Ние хостваме нашите Python пакети в хранилища на PyPi. Моля, следвайте инструкциите стъпка по стъпка как да инсталирате "Aspose.Words for Python via .NET" във вашата среда за разработчици.
Този пакет е съвместим с Python ≥3.5 и <3.12. Ако разработвате софтуер за Linux, моля, разгледайте допълнителните изисквания за gcc и libpython в продуктовата документация.