استخدم مكتبة Python لتقسيم المستندات إلى أجزاء. يمكنك دمج الصفحات المستخرجة مع البيانات الأخرى، ونتيجة لذلك، الحصول على مستندات من النموذج والمحتوى الذي تطلبه. يؤدي تقسيم المستندات إلى أجزاء إلى تسهيل التعاون في العمل عليها.
توفر مكتبة البرامج هذه Python مجموعة من الوظائف لتقسيم مستندات Word و PDF و EPUB و HTML و DOCX إلى أجزاء. يمكن استخدام تقسيم النص إلى ملفات منفصلة لتسهيل العمل مع أقسام المستندات. يمكن أن يكون إجراء تقسيم المستندات جزءًا من تقنية دمج البيانات في أنظمة المعلومات أو قواعد البيانات المؤتمتة.
توفر مكتبتنا لمطوري Python جميع الوظائف اللازمة للمستندات واستخراج صفحات المستندات وفقًا للوضع المحدد. هذا هو حل Python via .NET بذاته ولا يحتاج إلى تثبيت Microsoft Word أو Acrobat Reader أو تطبيقات أخرى.
قم بتقسيم محتوى المستند باستخدام معايير مختلفة في كود Python. يمكنك استخدام أوضاع استخراج الصفحات التالية: "تقسيم حسب العناوين"، "تقسيم حسب الأقسام"، "تقسيم الصفحة بصفحة"، "تقسيم حسب نطاقات الصفحات".
بعد تقسيم المستند، يمكنك تصدير النتيجة إلى تنسيق الملف المطلوب باستخدام طريقة 'Document.Save'. يمكنك أيضًا التحكم في كيفية تصدير أجزاء المستند إلى تنسيقات HTML أو EPUB باستخدام خاصية 'DocumentPartSavingCallback'، والتي ستتيح لك إعادة توجيه تدفقات الإخراج.
قم بتقسيم المستندات بسهولة باستخدام الحل الخاص بنا لـ Python via .NET. يوضح المثال التالي كيفية تقسيم مستند باستخدام Python:
pip install aspose-words
ينسخ
import aspose.words as aw
doc = aw.Document("Input.docx")
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"Output_{page + 1}.docx")
نستضيف حزم Python بنا في مستودعات PyPi. يرجى اتباع التعليمات خطوة بخطوة حول كيفية تثبيت "Aspose.Words for Python via .NET" في بيئة المطور لديك.
هذه الحزمة متوافقة مع Python ≥3.5 و <3.12. إذا قمت بتطوير برنامج لنظام التشغيل Linux، فيرجى إلقاء نظرة على المتطلبات الإضافية لدول gcc و libpython في وثائق المنتج.