हिन्दी
  1. उत्पादों
  2.   Aspose.Total
  3.   Python via .NET
  4.   Parse
  5.   DOC फ़ाइल से टेक्स्ट और छवियाँ ऑनलाइन निकालें और Python का उपयोग करें

DOC फ़ाइल को ऑनलाइन पार्स करें और साथ ही पायथन के माध्यम से टेक्स्ट या छवियाँ निकालें

शक्तिशाली पायथन आधारित DOC दस्तावेज़ पार्सर उपयोगिता एप्लिकेशन विकसित करें।पायथन के माध्यम से बीएमपी1 दस्तावेज़ छवियों और पाठ निष्कर्षण के लिए सूचीबद्ध कोड।

ऑनलाइन ऐप के माध्यम से DOC दस्तावेज़ को पार्स करें

  1. इसे अपलोड करके पार्स करने के लिए DOC फ़ाइल आयात करें।
  2. इसे पार्सर ऐप के ड्रैग और ड्रॉप के माध्यम से ड्रॉप क्षेत्र के अंदर क्लिक करके करें।
  3. DOC फ़ाइल के आकार और इंटरनेट स्पीड के आधार पर कुछ सेकंड प्रतीक्षा करें।
  4. दस्तावेज़ को पार्स करने के लिए ‘अभी पार्स करें’ बटन पर क्लिक करें।
  5. तुरंत देखने के लिए पार्स की गई फ़ाइलें डाउनलोड करें।

पायथन के माध्यम से DOC फ़ाइल से टेक्स्ट निकालें

  1. सीधे PyPI ( Aspose.Words ) से प्रोजेक्ट के भीतर संदर्भ API
  2. पाठ निष्कर्षण प्रक्रिया में शामिल करने के लिए नोड्स को परिभाषित करें
  3. पहले और आखिरी नोड्स को शामिल करें या बाहर करें
  4. निर्दिष्ट नोड्स में सामग्री निकालें
  5. निकाले गए पाठ के लिए एक अलग DOC दस्तावेज़ बनाएँ
  6. Extract_content फ़ंक्शन में सूचीबद्ध कोड.
 

DOC दस्तावेज़ टेक्स्ट निकालने के लिए पायथन में कोड उदाहरण

def extract_content(startNode : aw.Node, endNode : aw.Node, isInclusive : bool):
verify_parameter_nodes(startNode, endNode)
nodes = []
if (endNode.node_type == aw.NodeType.COMMENT_RANGE_END and isInclusive) :
node = find_next_node(aw.NodeType.COMMENT, endNode.next_sibling)
if (node != None) :
endNode = node
originalStartNode = startNode
originalEndNode = endNode
startNode = get_ancestor_in_body(startNode)
endNode = get_ancestor_in_body(endNode)
isExtracting = True
isStartingNode = True
currNode = startNode
while (isExtracting) :
cloneNode = currNode.clone(True)
isEndingNode = currNode == endNode
if (isStartingNode or isEndingNode) :
if (isEndingNode) :
process_marker(cloneNode, nodes, originalEndNode, currNode, isInclusive, False, not isStartingNode, False)
isExtracting = False
if (isStartingNode) :
process_marker(cloneNode, nodes, originalStartNode, currNode, isInclusive, True, True, False)
isStartingNode = False
else :
nodes.append(cloneNode)
if (currNode.next_sibling == None and isExtracting) :
nextSection = currNode.get_ancestor(aw.NodeType.SECTION).next_sibling.as_section()
currNode = nextSection.body.first_child
else :
currNode = currNode.next_sibling
if (isInclusive and originalEndNode == endNode and not originalEndNode.is_composite) :
include_next_paragraph(endNode, nodes)
return nodes
 

पायथन के माध्यम से DOC फ़ाइल से छवियाँ निकालें

  1. सीधे PyPI ( Aspose.Words ) से प्रोजेक्ट के भीतर संदर्भ API
  2. दस्तावेज़ ऑब्जेक्ट के शेप नोड्स में संग्रहीत छवियाँ
  3. सभी शेप नोड्स का चयन करने के लिए, Document.get_child_nodes विधि का उपयोग करें
  4. परिणामी नोड संग्रह के माध्यम से लूप करें
  5. यदि आकार.has_image सत्य लौटाता है।
  6. छवि डेटा निकालने के लिए शेप.इमेज_डेटा प्रॉपर्टी का उपयोग करें।
  7. छवि डेटा को किसी फ़ाइल में सहेजें
 

DOC दस्तावेज़ छवियाँ निकालने के लिए पायथन में कोड उदाहरण

doc = aw.Document(docs_base.my_dir + "sourcefile.docx")
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True)
imageIndex = 0
for shape in shapes :
shape = shape.as_shape()
if (shape.has_image) :
imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"
shape.image_data.save(docs_base.artifacts_dir + imageFileName)
imageIndex += 1
 
 

पायथन के माध्यम से DOC फ़ाइल पार्सर एप्लिकेशन विकसित करें

DOC पार्सर ऐप या उपयोगिता विकसित करने की आवश्यकता है? Aspose.Words for Python via .NET , Aspose.Total for Python via .NET की चाइल्ड एपीआई के साथ, कोई भी पायथन डेवलपर उपरोक्त एपीआई कोड को अपने दस्तावेज़ पार्सर एप्लिकेशन में एकीकृत कर सकता है।शक्तिशाली पायथन लाइब्रेरी छवियों के साथ-साथ पाठ को निकालने के लिए किसी भी दस्तावेज़ पार्सिंग समाधान को प्रोग्रामिंग करने की अनुमति देती है।इसके अलावा यह DOC प्रारूप सहित कई लोकप्रिय प्रारूपों का समर्थन कर सकता है।

पार्सर ऐप के लिए DOC फ़ाइल को संसाधित करने के लिए पायथन उपयोगिता

आपके सिस्टम पर “ Aspose.Words for Python via .NET ” या “ Aspose.Total for Python via .NET ” इंस्टॉल करने के लिए वैकल्पिक विकल्प हैं।कृपया वह चुनें जो आपकी आवश्यकताओं से मेल खाता हो और चरण-दर-चरण निर्देशों का पालन करें:

  • PyPI से Aspose.Words for Python via .NET इंस्टॉल करें
  • या निम्नलिखित पाइप कमांड का उपयोग करें pip install aspose.words

सिस्टम आवश्यकताएं

  • Python 3.5 या बाद का संस्करण स्थापित है
  • GCC-6 रनटाइम लाइब्रेरीज़ (या बाद में)।
  • .NET कोर रनटाइम की निर्भरताएँ। .NET कोर रनटाइम को स्थापित करना आवश्यक नहीं है।
  • पायथन 3.5-3.7 के लिए: पायथन के पाइमैलोक बिल्ड की आवश्यकता है।

    अधिक जानकारी के लिए कृपया उत्पाद दस्तावेज़ीकरण देखें।

पूछे जाने वाले प्रश्न

  • क्या मैं अपने एप्लिकेशन में उपरोक्त पायथन कोड का उपयोग कर सकता हूं?
    हां, इस कोड को डाउनलोड करने और पायथन-आधारित दस्तावेज़ पार्सर एप्लिकेशन को विकसित करने के उद्देश्य से इसका उपयोग करने के लिए आपका स्वागत है।यह कोड बैकएंड दस्तावेज़ प्रसंस्करण के क्षेत्र में आपकी परियोजनाओं की कार्यक्षमता और क्षमताओं को बढ़ाने के लिए एक मूल्यवान संसाधन के रूप में काम कर सकता है जैसे नोड्स को पढ़ना और पाठ और छवियों के निष्कर्षण के लिए दस्तावेज़ को लोड करना।
  • क्या यह ऑनलाइन दस्तावेज़ पार्सर ऐप केवल विंडोज़ पर काम करता है?
    आपके पास किसी भी डिवाइस पर दस्तावेज़ों को पार्स करने की सुविधा है, चाहे वह किसी भी ऑपरेटिंग सिस्टम पर चलता हो, चाहे वह विंडोज, लिनक्स, मैक ओएस या एंड्रॉइड हो।बस एक समकालीन वेब ब्राउज़र और एक सक्रिय इंटरनेट कनेक्शन की आवश्यकता है।
  • क्या DOC दस्तावेज़ को पार्स करने के लिए ऑनलाइन ऐप का उपयोग करना सुरक्षित है?
    बिल्कुल! हमारी सेवा के माध्यम से उत्पन्न आउटपुट फ़ाइलें 24 घंटे की समय सीमा के भीतर हमारे सर्वर से सुरक्षित रूप से और स्वचालित रूप से हटा दी जाएंगी।परिणामस्वरूप, इस अवधि के बाद इन फ़ाइलों से जुड़े डिस्प्ले लिंक काम करना बंद कर देंगे।
  • ऐप का उपयोग करने के लिए कौन सा ब्राउज़र चाहिए?
    आप ऑनलाइन DOC दस्तावेज़ पार्सर के लिए Google Chrome, फ़ायरफ़ॉक्स, ओपेरा, या Safari जैसे किसी भी आधुनिक वेब ब्राउज़र का उपयोग कर सकते हैं।हालाँकि, यदि आप एक डेस्कटॉप एप्लिकेशन विकसित कर रहे हैं, तो हम कुशल प्रबंधन के लिए Aspose.Total दस्तावेज़ प्रोसेसिंग एपीआई का उपयोग करने की सलाह देते हैं।

अन्वेषण करना फ़ाइल पार्सर Python के साथ विकल्प