DOT फ़ाइल को ऑनलाइन पार्स करें और साथ ही पायथन के माध्यम से टेक्स्ट या छवियाँ निकालें
शक्तिशाली पायथन आधारित DOT दस्तावेज़ पार्सर उपयोगिता एप्लिकेशन विकसित करें।पायथन के माध्यम से बीएमपी1 दस्तावेज़ छवियों और पाठ निष्कर्षण के लिए सूचीबद्ध कोड।
ऑनलाइन ऐप के माध्यम से DOT दस्तावेज़ को पार्स करें
- इसे अपलोड करके पार्स करने के लिए DOT फ़ाइल आयात करें।
- इसे पार्सर ऐप के ड्रैग और ड्रॉप के माध्यम से ड्रॉप क्षेत्र के अंदर क्लिक करके करें।
- DOT फ़ाइल के आकार और इंटरनेट स्पीड के आधार पर कुछ सेकंड प्रतीक्षा करें।
- दस्तावेज़ को पार्स करने के लिए ‘अभी पार्स करें’ बटन पर क्लिक करें।
- तुरंत देखने के लिए पार्स की गई फ़ाइलें डाउनलोड करें।
पायथन के माध्यम से DOT फ़ाइल से टेक्स्ट निकालें
- सीधे PyPI ( Aspose.Words ) से प्रोजेक्ट के भीतर संदर्भ API
- पाठ निष्कर्षण प्रक्रिया में शामिल करने के लिए नोड्स को परिभाषित करें
- पहले और आखिरी नोड्स को शामिल करें या बाहर करें
- निर्दिष्ट नोड्स में सामग्री निकालें
- निकाले गए पाठ के लिए एक अलग DOT दस्तावेज़ बनाएँ
- Extract_content फ़ंक्शन में सूचीबद्ध कोड.
DOT दस्तावेज़ टेक्स्ट निकालने के लिए पायथन में कोड उदाहरण
def extract_content(startNode : aw.Node, endNode : aw.Node, isInclusive : bool): | |
verify_parameter_nodes(startNode, endNode) | |
nodes = [] | |
if (endNode.node_type == aw.NodeType.COMMENT_RANGE_END and isInclusive) : | |
node = find_next_node(aw.NodeType.COMMENT, endNode.next_sibling) | |
if (node != None) : | |
endNode = node | |
originalStartNode = startNode | |
originalEndNode = endNode | |
startNode = get_ancestor_in_body(startNode) | |
endNode = get_ancestor_in_body(endNode) | |
isExtracting = True | |
isStartingNode = True | |
currNode = startNode | |
while (isExtracting) : | |
cloneNode = currNode.clone(True) | |
isEndingNode = currNode == endNode | |
if (isStartingNode or isEndingNode) : | |
if (isEndingNode) : | |
process_marker(cloneNode, nodes, originalEndNode, currNode, isInclusive, False, not isStartingNode, False) | |
isExtracting = False | |
if (isStartingNode) : | |
process_marker(cloneNode, nodes, originalStartNode, currNode, isInclusive, True, True, False) | |
isStartingNode = False | |
else : | |
nodes.append(cloneNode) | |
if (currNode.next_sibling == None and isExtracting) : | |
nextSection = currNode.get_ancestor(aw.NodeType.SECTION).next_sibling.as_section() | |
currNode = nextSection.body.first_child | |
else : | |
currNode = currNode.next_sibling | |
if (isInclusive and originalEndNode == endNode and not originalEndNode.is_composite) : | |
include_next_paragraph(endNode, nodes) | |
return nodes |
पायथन के माध्यम से DOT फ़ाइल से छवियाँ निकालें
- सीधे PyPI ( Aspose.Words ) से प्रोजेक्ट के भीतर संदर्भ API
- दस्तावेज़ ऑब्जेक्ट के शेप नोड्स में संग्रहीत छवियाँ
- सभी शेप नोड्स का चयन करने के लिए, Document.get_child_nodes विधि का उपयोग करें
- परिणामी नोड संग्रह के माध्यम से लूप करें
- यदि आकार.has_image सत्य लौटाता है।
- छवि डेटा निकालने के लिए शेप.इमेज_डेटा प्रॉपर्टी का उपयोग करें।
- छवि डेटा को किसी फ़ाइल में सहेजें
DOT दस्तावेज़ छवियाँ निकालने के लिए पायथन में कोड उदाहरण
doc = aw.Document(docs_base.my_dir + "sourcefile.docx") | |
shapes = doc.get_child_nodes(aw.NodeType.SHAPE, True) | |
imageIndex = 0 | |
for shape in shapes : | |
shape = shape.as_shape() | |
if (shape.has_image) : | |
imageFileName = f"Image.ExportImages.{imageIndex}_{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}" | |
shape.image_data.save(docs_base.artifacts_dir + imageFileName) | |
imageIndex += 1 |
पायथन के माध्यम से DOT फ़ाइल पार्सर एप्लिकेशन विकसित करें
DOT पार्सर ऐप या उपयोगिता विकसित करने की आवश्यकता है?
Aspose.Words for Python via .NET
,
Aspose.Total for Python via .NET
की चाइल्ड एपीआई के साथ, कोई भी पायथन डेवलपर उपरोक्त एपीआई कोड को अपने दस्तावेज़ पार्सर एप्लिकेशन में एकीकृत कर सकता है।शक्तिशाली पायथन लाइब्रेरी छवियों के साथ-साथ पाठ को निकालने के लिए किसी भी दस्तावेज़ पार्सिंग समाधान को प्रोग्रामिंग करने की अनुमति देती है।इसके अलावा यह DOT प्रारूप सहित कई लोकप्रिय प्रारूपों का समर्थन कर सकता है।
पार्सर ऐप के लिए DOT फ़ाइल को संसाधित करने के लिए पायथन उपयोगिता
आपके सिस्टम पर “
Aspose.Words for Python via .NET
” या “
Aspose.Total for Python via .NET
” इंस्टॉल करने के लिए वैकल्पिक विकल्प हैं।कृपया वह चुनें जो आपकी आवश्यकताओं से मेल खाता हो और चरण-दर-चरण निर्देशों का पालन करें:
- PyPI से Aspose.Words for Python via .NET इंस्टॉल करें
- या निम्नलिखित पाइप कमांड का उपयोग करें
pip install aspose.words
।
सिस्टम आवश्यकताएं
- Python 3.5 या बाद का संस्करण स्थापित है
- GCC-6 रनटाइम लाइब्रेरीज़ (या बाद में)।
- .NET कोर रनटाइम की निर्भरताएँ। .NET कोर रनटाइम को स्थापित करना आवश्यक नहीं है।
- पायथन 3.5-3.7 के लिए: पायथन के पाइमैलोक बिल्ड की आवश्यकता है।
अधिक जानकारी के लिए कृपया उत्पाद दस्तावेज़ीकरण देखें।
पूछे जाने वाले प्रश्न
- क्या मैं अपने एप्लिकेशन में उपरोक्त पायथन कोड का उपयोग कर सकता हूं?हां, इस कोड को डाउनलोड करने और पायथन-आधारित दस्तावेज़ पार्सर एप्लिकेशन को विकसित करने के उद्देश्य से इसका उपयोग करने के लिए आपका स्वागत है।यह कोड बैकएंड दस्तावेज़ प्रसंस्करण के क्षेत्र में आपकी परियोजनाओं की कार्यक्षमता और क्षमताओं को बढ़ाने के लिए एक मूल्यवान संसाधन के रूप में काम कर सकता है जैसे नोड्स को पढ़ना और पाठ और छवियों के निष्कर्षण के लिए दस्तावेज़ को लोड करना।
- क्या यह ऑनलाइन दस्तावेज़ पार्सर ऐप केवल विंडोज़ पर काम करता है?आपके पास किसी भी डिवाइस पर दस्तावेज़ों को पार्स करने की सुविधा है, चाहे वह किसी भी ऑपरेटिंग सिस्टम पर चलता हो, चाहे वह विंडोज, लिनक्स, मैक ओएस या एंड्रॉइड हो।बस एक समकालीन वेब ब्राउज़र और एक सक्रिय इंटरनेट कनेक्शन की आवश्यकता है।
- क्या DOT दस्तावेज़ को पार्स करने के लिए ऑनलाइन ऐप का उपयोग करना सुरक्षित है?बिल्कुल! हमारी सेवा के माध्यम से उत्पन्न आउटपुट फ़ाइलें 24 घंटे की समय सीमा के भीतर हमारे सर्वर से सुरक्षित रूप से और स्वचालित रूप से हटा दी जाएंगी।परिणामस्वरूप, इस अवधि के बाद इन फ़ाइलों से जुड़े डिस्प्ले लिंक काम करना बंद कर देंगे।
- ऐप का उपयोग करने के लिए कौन सा ब्राउज़र चाहिए?आप ऑनलाइन DOT दस्तावेज़ पार्सर के लिए Google Chrome, फ़ायरफ़ॉक्स, ओपेरा, या Safari जैसे किसी भी आधुनिक वेब ब्राउज़र का उपयोग कर सकते हैं।हालाँकि, यदि आप एक डेस्कटॉप एप्लिकेशन विकसित कर रहे हैं, तो हम कुशल प्रबंधन के लिए Aspose.Total दस्तावेज़ प्रोसेसिंग एपीआई का उपयोग करने की सलाह देते हैं।