DOC फ़ाइल को ऑनलाइन पार्स करें और साथ ही पायथन के माध्यम से टेक्स्ट या छवियाँ निकालें
शक्तिशाली पायथन आधारित DOC दस्तावेज़ पार्सर उपयोगिता एप्लिकेशन विकसित करें।पायथन के माध्यम से बीएमपी1 दस्तावेज़ छवियों और पाठ निष्कर्षण के लिए सूचीबद्ध कोड।
ऑनलाइन ऐप के माध्यम से DOC दस्तावेज़ को पार्स करें
- इसे अपलोड करके पार्स करने के लिए DOC फ़ाइल आयात करें।
- इसे पार्सर ऐप के ड्रैग और ड्रॉप के माध्यम से ड्रॉप क्षेत्र के अंदर क्लिक करके करें।
- DOC फ़ाइल के आकार और इंटरनेट स्पीड के आधार पर कुछ सेकंड प्रतीक्षा करें।
- दस्तावेज़ को पार्स करने के लिए ‘अभी पार्स करें’ बटन पर क्लिक करें।
- तुरंत देखने के लिए पार्स की गई फ़ाइलें डाउनलोड करें।
पायथन के माध्यम से DOC फ़ाइल से टेक्स्ट निकालें
- सीधे PyPI ( Aspose.Words ) से प्रोजेक्ट के भीतर संदर्भ API
- पाठ निष्कर्षण प्रक्रिया में शामिल करने के लिए नोड्स को परिभाषित करें
- पहले और आखिरी नोड्स को शामिल करें या बाहर करें
- निर्दिष्ट नोड्स में सामग्री निकालें
- निकाले गए पाठ के लिए एक अलग DOC दस्तावेज़ बनाएँ
- Extract_content फ़ंक्शन में सूचीबद्ध कोड.
DOC दस्तावेज़ टेक्स्ट निकालने के लिए पायथन में कोड उदाहरण
पायथन के माध्यम से DOC फ़ाइल से छवियाँ निकालें
- सीधे PyPI ( Aspose.Words ) से प्रोजेक्ट के भीतर संदर्भ API
- दस्तावेज़ ऑब्जेक्ट के शेप नोड्स में संग्रहीत छवियाँ
- सभी शेप नोड्स का चयन करने के लिए, Document.get_child_nodes विधि का उपयोग करें
- परिणामी नोड संग्रह के माध्यम से लूप करें
- यदि आकार.has_image सत्य लौटाता है।
- छवि डेटा निकालने के लिए शेप.इमेज_डेटा प्रॉपर्टी का उपयोग करें।
- छवि डेटा को किसी फ़ाइल में सहेजें
DOC दस्तावेज़ छवियाँ निकालने के लिए पायथन में कोड उदाहरण
पायथन के माध्यम से DOC फ़ाइल पार्सर एप्लिकेशन विकसित करें
DOC पार्सर ऐप या उपयोगिता विकसित करने की आवश्यकता है?
Aspose.Words for Python via .NET
,
Aspose.Total for Python via .NET
की चाइल्ड एपीआई के साथ, कोई भी पायथन डेवलपर उपरोक्त एपीआई कोड को अपने दस्तावेज़ पार्सर एप्लिकेशन में एकीकृत कर सकता है।शक्तिशाली पायथन लाइब्रेरी छवियों के साथ-साथ पाठ को निकालने के लिए किसी भी दस्तावेज़ पार्सिंग समाधान को प्रोग्रामिंग करने की अनुमति देती है।इसके अलावा यह DOC प्रारूप सहित कई लोकप्रिय प्रारूपों का समर्थन कर सकता है।
पार्सर ऐप के लिए DOC फ़ाइल को संसाधित करने के लिए पायथन उपयोगिता
आपके सिस्टम पर “
Aspose.Words for Python via .NET
” या “
Aspose.Total for Python via .NET
” इंस्टॉल करने के लिए वैकल्पिक विकल्प हैं।कृपया वह चुनें जो आपकी आवश्यकताओं से मेल खाता हो और चरण-दर-चरण निर्देशों का पालन करें:
- PyPI से Aspose.Words for Python via .NET इंस्टॉल करें
- या निम्नलिखित पाइप कमांड का उपयोग करें
pip install aspose.words
।
सिस्टम आवश्यकताएं
- Python 3.5 या बाद का संस्करण स्थापित है
- GCC-6 रनटाइम लाइब्रेरीज़ (या बाद में)।
- .NET कोर रनटाइम की निर्भरताएँ। .NET कोर रनटाइम को स्थापित करना आवश्यक नहीं है।
- पायथन 3.5-3.7 के लिए: पायथन के पाइमैलोक बिल्ड की आवश्यकता है।
अधिक जानकारी के लिए कृपया उत्पाद दस्तावेज़ीकरण देखें।
पूछे जाने वाले प्रश्न
- क्या मैं अपने एप्लिकेशन में उपरोक्त पायथन कोड का उपयोग कर सकता हूं?हां, इस कोड को डाउनलोड करने और पायथन-आधारित दस्तावेज़ पार्सर एप्लिकेशन को विकसित करने के उद्देश्य से इसका उपयोग करने के लिए आपका स्वागत है।यह कोड बैकएंड दस्तावेज़ प्रसंस्करण के क्षेत्र में आपकी परियोजनाओं की कार्यक्षमता और क्षमताओं को बढ़ाने के लिए एक मूल्यवान संसाधन के रूप में काम कर सकता है जैसे नोड्स को पढ़ना और पाठ और छवियों के निष्कर्षण के लिए दस्तावेज़ को लोड करना।
- क्या यह ऑनलाइन दस्तावेज़ पार्सर ऐप केवल विंडोज़ पर काम करता है?आपके पास किसी भी डिवाइस पर दस्तावेज़ों को पार्स करने की सुविधा है, चाहे वह किसी भी ऑपरेटिंग सिस्टम पर चलता हो, चाहे वह विंडोज, लिनक्स, मैक ओएस या एंड्रॉइड हो।बस एक समकालीन वेब ब्राउज़र और एक सक्रिय इंटरनेट कनेक्शन की आवश्यकता है।
- क्या DOC दस्तावेज़ को पार्स करने के लिए ऑनलाइन ऐप का उपयोग करना सुरक्षित है?बिल्कुल! हमारी सेवा के माध्यम से उत्पन्न आउटपुट फ़ाइलें 24 घंटे की समय सीमा के भीतर हमारे सर्वर से सुरक्षित रूप से और स्वचालित रूप से हटा दी जाएंगी।परिणामस्वरूप, इस अवधि के बाद इन फ़ाइलों से जुड़े डिस्प्ले लिंक काम करना बंद कर देंगे।
- ऐप का उपयोग करने के लिए कौन सा ब्राउज़र चाहिए?आप ऑनलाइन DOC दस्तावेज़ पार्सर के लिए Google Chrome, फ़ायरफ़ॉक्स, ओपेरा, या Safari जैसे किसी भी आधुनिक वेब ब्राउज़र का उपयोग कर सकते हैं।हालाँकि, यदि आप एक डेस्कटॉप एप्लिकेशन विकसित कर रहे हैं, तो हम कुशल प्रबंधन के लिए Aspose.Total दस्तावेज़ प्रोसेसिंग एपीआई का उपयोग करने की सलाह देते हैं।
अन्वेषण करना फ़ाइल पार्सर Python के साथ विकल्प
पार्स DOC फ़ाइलें
(Microsoft Word Binary Format)
पार्स DOCX फ़ाइलें
(Office 2007+ Word Document)
पार्स DOT फ़ाइलें
(Microsoft Word Template Files)
पार्स DOTX फ़ाइलें
(Microsoft Word Template File)
पार्स ODP फ़ाइलें
(OpenDocument Presentation Format)
पार्स ODT फ़ाइलें
(OpenDocument Text File Format)
पार्स OTT फ़ाइलें
(OpenDocument Standard Format)
पार्स PDF फ़ाइलें
(Portable Document Format)
पार्स PPT फ़ाइलें
(Microsoft PowerPoint 97-2003)
पार्स PPTX फ़ाइलें
(Open XML presentation Format)
पार्स RTF फ़ाइलें
(Rich Text Format)
पार्स WORD फ़ाइलें
(WordProcessing File Formats)