.NET API का उपयोग करके दस्तावेज़ खोजें

.NET के लिए Aspose.Total के साथ अत्यधिक कुशल तरीके से Microsoft Office Word, Excel, PowerPoint और PDF फ़ाइलों सहित दस्तावेज़ों की एक विस्तृत श्रृंखला से आसानी से डेटा खोजें और प्राप्त करें।

 

विविध दस्तावेज़ फ़ाइल स्वरूपों के लिए पाठ खोज और सामग्री अनुक्रमण को सक्षम करना उपयोगकर्ताओं को उत्पादकता को अनुकूलित करने, डेटा पुनर्प्राप्ति को सुव्यवस्थित करने और संगठनों और अनुप्रयोगों में सूचना प्रबंधन को बढ़ाने का अधिकार देता है। दस्तावेज़ों के भीतर पाठ-आधारित खोजों को सक्षम करके और दस्तावेज़ फ़ाइल स्वरूपों की एक विविध श्रृंखला से जानकारी की कुशल पुनर्प्राप्ति के लिए अनुक्रमणिका स्थापित करके अपने .NET-आधारित सॉफ़्टवेयर या सिस्टम की कार्यक्षमता बढ़ाएँ।

दस्तावेज़ों में खोजने के मुख्य कारण

  1. दस्तावेज़ संगठन
  2. सूचना की पुनर्प्राप्ति
  3. सामग्री सत्यापन
  4. सामग्री सारांशीकरण
  5. पाठ विश्लेषण
  6. डेटा निकालना
  7. दस्तावेज़ अनुक्रमण

पीडीएफ दस्तावेज़ खोजें

हम Aspose.PDF for .NET का उपयोग करते हैं, Aspose.Total for .NET का एक चाइल्ड एपीआई जिसे विशेष दस्तावेज़ हेरफेर सुविधाओं के साथ-साथ दस्तावेज़ सामग्री को पुनर्प्राप्त करने और खोजने से जुड़े कार्यों के लिए डिज़ाइन किया गया है। पीडीएफ दस्तावेज़ के साथ इंटरैक्ट करने के लिए नीचे दिए गए कोड स्निपेट को C# में लिखा गया है। यह पहले दस्तावेज़ के भीतर गैर-व्हाट्सएप वर्णों के अनुक्रमों की खोज के लिए एक नियमित अभिव्यक्ति पैटर्न सेट करता है। इसके बाद, यह पीडीएफ के पहले पृष्ठ तक पहुंचता है और निर्दिष्ट नियमित अभिव्यक्ति का उपयोग करके उस पृष्ठ पर पाठ की खोज करने के लिए टेक्स्टफ्रैगमेंटएब्जॉर्बर को नियोजित करता है। फिर कोड खोजे गए पाठ अंशों को एक संग्रह में एकत्र करता है। अंत में, यह इस संग्रह के माध्यम से पुनरावृत्त होता है और प्रत्येक पहचाने गए पाठ टुकड़े को कंसोल पर आउटपुट करता है। अनिवार्य रूप से, यह कोड स्निपेट एक पीडीएफ दस्तावेज़ से विशिष्ट टेक्स्ट पैटर्न निकालने और प्रदर्शित करने के लिए एक तंत्र के रूप में कार्य करता है। इसके अलावा, .NET सर्च एपीआई Microsoft शब्द दस्तावेज़ खोज और अन्य प्रारूपों का भी समर्थन करता है।

पीडीएफ दस्तावेज़ खोज के लिए सी# कोड