पायथन एपीआई का उपयोग करके दस्तावेज़ों को विभाजित करना

Aspose.Total for Python via .NET का उपयोग करके किसी भी फ़ाइल को पृष्ठ संख्या या कुछ परिभाषित पैटर्न द्वारा एकाधिक फ़ाइलों में विभाजित करें।

 

दस्तावेज़ विभाजन से तात्पर्य किसी एकल दस्तावेज़ या बड़ी फ़ाइल को विशिष्ट मानदंडों के आधार पर कई छोटे दस्तावेज़ों में विभाजित करने की प्रक्रिया से है। यह पृष्ठ संख्या, परिभाषित पैटर्न, सामग्री या अन्य कारकों द्वारा किया जा सकता है। दस्तावेज़ों को पृष्ठ संख्या या परिभाषित पैटर्न के आधार पर विभाजित करने की आवश्यकता कई व्यावहारिक कारणों से उत्पन्न होती है। इसके अलावा, दस्तावेज़ विभाजन विभिन्न उद्देश्यों को पूरा करता है, जैसे दस्तावेज़ संगठन को बढ़ाना, डेटा निष्कर्षण की सुविधा, सहयोग में सुधार और विशिष्ट व्यवसाय या नियामक आवश्यकताओं को पूरा करना। यह दस्तावेज़ों के प्रबंधन और उनके साथ काम करने में अधिक लचीलापन प्रदान करता है, जिससे वे अधिक कुशल और उपयोगकर्ता-अनुकूल बन जाते हैं।

दस्तावेज़ों को विभाजित करने के मुख्य कारण

  • सरल उपयोग
  • वितरण
  • डेटा निकालना
  • मुद्रण एवं प्रकाशन
  • सामग्री प्रबंधन
  • सहयोग
  • कानूनी और विनियामक अनुपालन
  • संग्रह
  • डाटा प्राइवेसी

माइक्रोसॉफ्ट ऑफिस दस्तावेज़ों को विभाजित करें

Microsoft Office दस्तावेज़ों को विभाजित करने के लिए, कोई आपकी विशिष्ट आवश्यकताओं के आधार पर विभिन्न तरीकों का उपयोग कर सकता है। Aspose.Total for Python via .NET का चाइल्ड API Aspose.Words for Python via .NET , Python सहित विभिन्न प्रोग्रामिंग भाषाओं में Microsoft Word दस्तावेज़ों के साथ काम करने के लिए एक लोकप्रिय लाइब्रेरी है। यह संगठन, सहयोग, वितरण और दस्तावेज़ सामग्री के प्रबंधन के संदर्भ में व्यावहारिक लाभ प्रदान करने के लिए दस्तावेज़ हेरफेर, रूपांतरण और विभाजन के लिए व्यापक क्षमताएं प्रदान करता है। किसी दस्तावेज़ को विभाजित करने का निर्णय दस्तावेज़ और इसके साथ काम करने वाले उपयोगकर्ताओं की विशिष्ट आवश्यकताओं और उद्देश्यों पर आधारित होना चाहिए।

माइक्रोसॉफ्ट वर्ड दस्तावेज़ को विभाजित करने के लिए पायथन कोड

import aspose.words as aw
doc = aw.Document("splitDocumentPageWise.docx")
pageCount = doc.page_count
for page in range(0, pageCount):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"split_by_page_{page + 1}.docx")

पायथन के माध्यम से पीडीएफ फाइलों को विभाजित करें

पीडीएफ दस्तावेजों को विभाजित करने में एक पीडीएफ फाइल को कई छोटी पीडीएफ फाइलों या अनुभागों में विभाजित करना शामिल है। यह प्रक्रिया विभिन्न कारणों से उपयोगी हो सकती है, जैसे पीडीएफ से विशिष्ट सामग्री को प्रबंधित करना, साझा करना या निकालना। पीडीएफ दस्तावेज़ों को विभाजित करने के लिए यहां कुछ सामान्य तरीके और परिदृश्य दिए गए हैं:

  1. पेज रेंज विभाजन
  2. बुकमार्क द्वारा विभाजन
  3. पाठ पैटर्न विभाजन
  4. रिक्त पृष्ठ का पता लगाना
  5. फ़ाइल आकार विभाजन
  6. प्रपत्र फ़ील्ड विभाजन
  7. नामित गंतव्य
  8. पृष्ठ-स्तरीय विभाजन
  9. सामग्री विभाजन की तालिका
  10. दिनांक-आधारित विभाजन
  11. सामग्री निष्कर्षण

वर्ड और पीडीएफ प्रारूपों के अलावा, एपीआई पावरप्वाइंट प्रस्तुति सहित विभिन्न अन्य प्रारूपों को विभाजित करने का समर्थन करता है। पायथन अनुप्रयोगों के लिए पीडीएफ दस्तावेज़ को विभाजित करने के लिए नीचे सूचीबद्ध कोड।

पीडीएफ दस्तावेज़ को विभाजित करने के लिए पायथन कोड

import aspose.pdf as ap
document = ap.Document("input.pdf")
for page in document.pages:
splitPDF = ap.Document()
splitPDF.pages.add(page)
splitPDF.save("Page_" + str(page.number) + ".pdf")