Aspose OCR लाइब्रेरी क्यों चुनें?

सेकंड में अपने .NET ऐप्स में शक्तिशाली OCR क्षमताओं का निर्माण करें। हमारा आसानी से उपयोग करने वाला OCR API आपको छवियों और स्कैन से पाठ निकालने, खोजने योग्य PDFs बनाने, और अधिक से अधिक C# कोड के साथ अधिक बनाता है। .NET डेस्कटॉप, वेब, क्लाउड और सर्वर रहित कार्यों के लिए आदर्श।
OCR का अनुभव करें जो केवल पाठ को नहीं निकालता है, लेकिन इसे AI के साथ समझता है और बढ़ाता है। हमारी सुविधाओं और लाभों के बारे में अधिक जानने के लिए नीचे दिए गए आइटम पर क्लिक करें।

Illustration ocr

वैश्विक ओसीआर अनुप्रयोग

C# OCR अंग्रेजी, सिरिलिक, अरबी, फारसी, चीनी, जापानी, कोरियाई, हिंदी, तमिल और मिश्रित भाषा के ग्रंथों को मान्यता देता है।

सब कुछ पढ़ें

स्कैनर या कैमरे के माध्यम से प्राप्त किसी भी फ़ाइल से पाठ प्राप्त करें, और सीधे वेब लिंक से छवियों को संसाधित करें।

विश्वसनीय परिणाम

सभी छवियों के लिए उच्च मान्यता सटीकता प्राप्त करें, जिनमें वे शामिल हैं, जो बाहर-फोकस, घुमाए गए, विकृत और शोर हैं।

बैच मान्यता

फोल्डर और अभिलेखागार से सभी छवियों को मान्यता दें; मल्टी-पेज पीडीएफ दस्तावेज़ और टीआईएफएफ छवियों को पढ़ें।

लेआउट का पता लगाना

लेआउट की परवाह किए बिना निकाले गए पाठ के सही क्रम को सुनिश्चित करने के लिए छवियों में सामग्री ब्लॉक को पहचानें और वर्गीकृत करें।

एलएलएम का उपयोग करके एआई पोस्टप्रोसेसिंग

न केवल OCR-होशियार, त्रुटि-मुक्त पाठ मान्यता के लिए आपका ऑल-इन-वन एआई समाधान। Aspose.ocr अब AI और LLMS को उन मॉडलों को चुनने के लिए एकीकृत करता है जो OCR सटीकता को बढ़ाते हैं - फिक्सिंग त्रुटियों, लापता पाठ को पुनर्स्थापित करना और समग्र मान्यता गुणवत्ता में सुधार करना।

लाइव कोड नमूना

.NET OCR नए डेवलपर्स के लिए भी, OCR API के साथ एक तुच्छ और सीधा कार्य बन जाता है। कोड की बस कुछ पंक्तियाँ एक छवि से पाठ निकालने और इसे स्क्रीन पर प्रदर्शित करने के लिए पर्याप्त हैं। यह वास्तव में इतना सरल है - इसे आज़माएं।

पहचानने के लिए तैयार पहचानने के लिए तैयार यहां एक फ़ाइल छोड़ें या ब्राउज़ करने के लिए क्लिक करें *

* अपनी फ़ाइलों को अपलोड करके या उस सेवा का उपयोग करके आप हमारे साथ सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.

मान्यता परिणाम
 

छवि को पाठ में परिवर्तित करें

और ज्यादा उदाहरण >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

प्लेटफ़ॉर्म स्वतंत्रता

Cross-Platform OCR लाइब्रेरी .NET, .NET कोर या .NET फ्रेमवर्क के तहत हर जगह काम कर सकती है-चाहे वह स्थानीय मशीन पर हो, वेब सर्वर पर, या क्लाउड में।

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

समर्थित फ़ाइल स्वरूप

Aspose.OCR for .NET किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/net/supported-file-formats/ ) आप एक स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणामों को सहेजा जा सकता है, एक डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।

इमेजिस

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

बैच ओसीआर

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

मान्यता परिणाम

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

LLM- संचालित OCR: AI भाषा मॉडल द्वारा संचालित OCR की अगली पीढ़ी।

परिणाम सटीकता मान्यता पर नहीं रुकती है - बाहरी एलएलएम का उपयोग करके पाठ को परिष्कृत करके गुणवत्ता के अगले स्तर को अनलॉक करें।

  • मान्यता प्राप्त पाठ में स्वचालित रूप से वर्तनी और व्याकरण को सही करें।
  • मल्टी-पेज स्कैन में विसंगतियों और स्वरूपण मुद्दों को सामान्य करें।
  • त्वरित-संचालित मॉडल का उपयोग करके विषय-विशिष्ट शब्दावली के लिए मान्यता परिणामों को अनुकूलित करें।
  • किसी भी बाहरी एलएलएम पाइपलाइन को अपने OCR वर्कफ़्लो में कोड की कुछ पंक्तियों के साथ एकीकृत करें।

किसी भी सामग्री के लिए उपयुक्त

C# में पाठ मान्यता की सटीकता और विश्वसनीयता काफी हद तक छवि गुणवत्ता पर निर्भर करती है। .NET OCR बेहतर मान्यता परिणाम सुनिश्चित करने के लिए स्वचालित और मैनुअल छवि अनुकूलन का एक पूरा सेट प्रदान करता है।

शक्तिशाली छवि प्रसंस्करण, पूरी तरह से अनुकूलन योग्य पाठ का पता लगाने, पोस्ट-प्रोसेसिंग, और स्वचालित वर्तनी सुधार किसी भी स्कैन या उच्चतम सटीकता के साथ किसी भी स्कैन या फोटो से पाठ निष्कर्षण को सक्षम करते हैं।

OCR संसाधन अनुकूलन

Aspose ‘C# OCR लाइब्रेरी प्रत्येक विशिष्ट उपयोग के मामले के लिए मान्यता गति, गुणवत्ता और संसाधन उपयोग के अत्यधिक लचीले संतुलन को सक्षम करती है:

  • पूरी तरह से मान्यता और तेजी से मान्यता के बीच चुनें।
  • मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या हमारे .NET OCR लाइब्रेरी को प्रोसेसर कोर की संख्या के लिए स्वचालित रूप से स्केल करने की अनुमति दें।
  • GPU को गणना को बंद करके CPU को मुक्त करें।

140+ मान्यता भाषाएँ

हमारी C# OCR लाइब्रेरी वैश्विक स्तर पर दस्तावेज़ प्रसंस्करण, डेटा निष्कर्षण और सामग्री डिजिटलीकरण के लिए एक सार्वभौमिक समाधान है। यूरोपीय, मध्य-पूर्व और एशियाई लेखन स्क्रिप्ट के एक विशाल सरणी के लिए समर्थन के साथ, यह किसी भी देश और व्यवसाय के लिए अच्छी तरह से अनुकूलित है।

आप मिश्रित भाषाओं में लिखे गए दस्तावेजों को पहचान सकते हैं, जैसे कि चीनी/अंग्रेजी, अरबी/फ्रेंच या सिरिलिक/अंग्रेजी। निम्नलिखित भाषाओं का समर्थन किया जाता है:

  • ** विस्तारित लैटिन **: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
  • ** सिरिलिक ** वर्णमाला: रूसी, यूक्रेनी, कजाख, बल्गेरियाई, मिश्रित सिरिलिक/अंग्रेजी ग्रंथों सहित;
  • अरबी, फारसी, उर्दू, अंग्रेजी के साथ मिश्रित ग्रंथों सहित;
  • चीनी, कोरियाई, जापानी, देवनागरी और द्रविड़ियन भाषाएं, जिनमें हिंदी, तमिल, मराठी और अन्य शामिल हैं।

सुविधाएँ और क्षमता

C# OCR स्वचालित रूप से फ़ोटो या स्कैन से पाठ निकालता है, दस्तावेजों के मैनुअल रिटाइपिंग की आवश्यकता को समाप्त करता है।

Feature icon

फोटो ओसीआर

स्कैन-स्तरीय सटीकता के साथ स्मार्टफोन तस्वीरों से पाठ निकालें।

Feature icon

खोज योग्य पीडीएफ

किसी भी स्कैन को पूरी तरह से खोजा और सूचकांक योग्य दस्तावेज़ में बदलें।

Feature icon

URL मान्यता

स्थानीय रूप से डाउनलोड किए बिना URL से एक छवि को पहचानें।

Feature icon

थोक मान्यता

बहु-पृष्ठ दस्तावेज़, फ़ोल्डर और अभिलेखागार से सभी चित्र पढ़ें।

Feature icon

कोई भी फ़ॉन्ट और शैली

सभी लोकप्रिय टाइपफेस और शैलियों में पाठ को पहचानें और पहचानें।

Feature icon

ठीक धुन मान्यता

सर्वोत्तम मान्यता परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।

Feature icon

बानान चेकर

गलत शब्दों को स्वचालित रूप से सही करके परिणामों में सुधार करें।

Feature icon

छवियों में पाठ खोजें

छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति के लिए खोजें।

Feature icon

छवि ग्रंथों की तुलना करें

मामले और लेआउट की परवाह किए बिना, दो छवियों पर ग्रंथों की तुलना करें।

Feature icon

एआई संचालित सुधार

ट्रांसफॉर्मर-आधारित एलएलएमएस का उपयोग करके गलत तरीके से मान्यता प्राप्त शब्दों और व्याकरण को ठीक करें-कोई कस्टम प्रशिक्षण की आवश्यकता नहीं है।

Feature icon

सिमेंटिक पोस्टप्रोसेसिंग

वर्णों से परे जाएं: बेहतर सामग्री की गुणवत्ता और भाषा सामान्यीकरण के लिए एलएलएम के साथ शोर ओसीआर आउटपुट को परिष्कृत करें।

Feature icon

प्लग-इन एलएलएम पाइपलाइन

OCR मान्यता गलतियों को ठीक करने और अपूर्ण या खंडित पाठ को पुनर्स्थापित करने के लिए बाहरी भाषा मॉडल कनेक्ट करें।

OCR का उपयोग करना आसान है

हमारे C# OCR API के साथ, आपको केवल C# कोड की कुछ पंक्तियों की आवश्यकता है ताकि छवि को पाठ में परिवर्तित किया जा सके, एक खोज योग्य PDF बनाएं, दस्तावेज़ में मान्यता परिणाम सहेजें, और कई और अधिक। हमारे OCR API को अपने .NET समाधानों में कैसे एकीकृत करें, यह समझने के लिए कोड नमूनों का अन्वेषण करें।

इंस्टालेशन

.NET OCR को न्यूनतम निर्भरता के साथ एक Nuget पैकेज या डाउनलोड करने योग्य फ़ाइल के रूप में वितरित किया जाता है। पैकेज को Microsoft Visual Studio से सीधे आपकी परियोजना में जोड़ा जा सकता है। बस इसे अपनी परियोजना में स्थापित करें और आप छवियों से पाठ निकालने और किसी भी समर्थित प्रारूप में मान्यता परिणामों को सहेजने के लिए तैयार हैं। यदि आपके सिस्टम में CUDA सक्षम GPU है, तो आप मान्यता के प्रदर्शन को बढ़ाने के लिए gpu-acaselerated OCR इंजन का उपयोग कर सकते हैं।

आप कुछ प्रतिबंधों के साथ स्थापना के बाद .NET के लिए Aspose OCR का उपयोग शुरू कर सकते हैं। एक अस्थायी लाइसेंस 30 दिनों के लिए परीक्षण संस्करण की सभी सीमाओं को हटा देता है। एक पूरी तरह कार्यात्मक OCR एप्लिकेशन का निर्माण शुरू करने के लिए इसका उपयोग करें और बाद में .NET के लिए OCR खरीदने के लिए अंतिम निर्णय लें।

एक तस्वीर से पाठ निकालें

जब लोग आमतौर पर OCR (ऑप्टिकल चरित्र मान्यता) के बारे में सोचते हैं, तो पहला एसोसिएशन अक्सर प्राथमिक कैप्चर डिवाइस के रूप में एक स्कैनर के साथ होता है। इस एसोसिएशन के ऐतिहासिक कारण हैं और अभी भी कई संदर्भों में प्रचलित है, जो बेजोड़ गुणवत्ता के साथ भौतिक दस्तावेजों से मुद्रित पाठ को कैप्चर करने के लिए सुसंगत और नियंत्रित वातावरण प्रदान करता है। हालांकि, एक स्कैनर विशेष उपकरण है जो हमेशा हाथ में नहीं होता है और इसे संचालित करने के लिए एक स्थिर वर्कस्टेशन की आवश्यकता होती है। सौभाग्य से, आधुनिक दुनिया पारंपरिक स्कैनर के लिए एक सुविधाजनक विकल्प प्रदान करती है - एक स्मार्टफोन कैमरा। स्मार्टफोन कैमरा तकनीक में प्रगति यह सुनिश्चित करती है कि यहां तक कि एक एंट्री-लेवल स्मार्टफोन भी OCR- तैयार दस्तावेजों को कैप्चर करने के लिए पर्याप्त गुणवत्ता प्रदान करता है। और अंतर्निहित मेमोरी बड़ी मात्रा में दस्तावेजों, समाचार पत्रों, पुस्तकों, सड़क के संकेतों और अन्य पाठ को डिजिटाइज़ करने के लिए पहले से कहीं अधिक आसान बनाती है। आपको उन तस्वीरों को मशीन-पठनीय पाठ में बदलने के लिए सही तकनीक की आवश्यकता है।

हमारी C# OCR लाइब्रेरी को विशेष रूप से सभी प्रकार की छवियों को आउट-ऑफ-द-बॉक्स को पहचानने के लिए डिज़ाइन किया गया है और यहां तक कि कम गुणवत्ता वाली तस्वीरों को भी संभालने के लिए ठीक-ठीक ट्यून किया जा सकता है। एक आधुनिक स्मार्टफोन के साथ संयुक्त, यह आपको अधिकांश रोजमर्रा की स्कैनिंग और पाठ मान्यता कार्यों के लिए शक्तिशाली OCR एप्लिकेशन बनाने की अनुमति देता है। सबसे उन्नत छवि प्रसंस्करण और दस्तावेज़ संरचना विश्लेषण कोड की कुछ पंक्तियों में किया जाता है, जिससे आप जटिल गणितीय एल्गोरिदम, तंत्रिका नेटवर्क और अन्य तकनीकी पेचीदगियों के बजाय व्यवसाय पर ध्यान केंद्रित कर सकते हैं।

फोटो ओसीआर - सी#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

स्कैन से एक खोज योग्य पीडीएफ बनाएं

पीडीएफ पेपर दस्तावेजों को स्कैन करने के लिए सबसे लोकप्रिय प्रारूपों में से एक है, विशेष रूप से एक ही फ़ाइल में कई पृष्ठों को संयोजित करने की क्षमता के कारण। यह प्रारूप व्यापक रूप से अनुबंध, चालान, कानूनी दस्तावेज, पासपोर्ट और आईडी कार्ड, और व्यक्तियों, व्यवसायों, बैंकों और सरकारी एजेंसियों के बीच कई अन्य दस्तावेजों के आदान -प्रदान के लिए उपयोग किया जाता है। हालांकि, किसी भी स्कैन किए गए पीडीएफ अनिवार्य रूप से छवियों का एक संग्रह है। इसमें मशीन-पठनीय पाठ नहीं है, इसलिए उपयोगकर्ता दस्तावेज़ सामग्री को खोज, कॉपी या अन्यथा हेरफेर नहीं कर सकते हैं।

aspose .net ocr आपको किसी भी स्कैन किए गए पीडीएफ को पूरी तरह से खोजा और अनुक्रमित दस्तावेज़ में परिवर्तित करने के लिए एक तेज, आसान और अत्यधिक विश्वसनीय तरीका प्रदान करता है। यह पृष्ठ सामग्री को सही ढंग से पहचानता है, इसे मूल छवि पर एक मशीन-पठनीय पाठ परत में परिवर्तित करता है जिसे चुना जा सकता है, कॉपी किया जा सकता है, पाठ-से-स्पीच सॉफ़्टवेयर द्वारा पढ़ा जा सकता है, और यहां तक कि स्वचालित रूप से अनुवादक, समर, और अन्य एआई-संचालित एनालिटिक्स टूल द्वारा संसाधित किया जा सकता है।

PDF में टेक्स्ट ओवरले जोड़ें - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

छवियों में पाठ के लिए खोजें

डिजिटल अभिलेखागार, विशेष रूप से बड़े संगठनों में, अक्सर स्कैन और फ़ोटो का एक विशाल संग्रह होता है, जिनमें से कई में बहु-पृष्ठ दस्तावेज़ हो सकते हैं। इस तरह के अभिलेखागार का कुशल प्रबंधन और संगठन प्रभावी रूप से आसान सूचना पुनर्प्राप्ति और नेविगेशन के लिए आवश्यक है। हालांकि, छवियों में मशीन-पठनीय पाठ नहीं होता है, जिससे दस्तावेज़ सामग्री को खोज और विश्लेषण करना असंभव हो जाता है।

C# OCR लाइब्रेरी आपको फ़ॉन्ट, टेक्स्ट आकार, स्टाइल और अन्य मापदंडों की परवाह किए बिना आसानी से छवियों में पाठ की खोज करने की अनुमति देती है। पुस्तकालय केस-असंवेदनशील खोजों और नियमित अभिव्यक्तियों का भी समर्थन करता है, जो विभिन्न अनुप्रयोगों और उद्योगों में बेहद उपयोगी हैं। इस कार्यक्षमता का उपयोग पाठ में पाए गए सामग्री, कीवर्ड, या पैटर्न के आधार पर दस्तावेजों को वर्गीकृत करने के लिए किया जा सकता है; समझौतों और अनुबंधों के भीतर विशिष्ट शर्तों या खंडों की खोज; उनके भीतर पाए जाने वाले कीवर्ड या सामग्री के आधार पर फ़ाइलों को पुनर्गठित करना; दस्तावेजों के भीतर व्यक्तिगत डेटा का पता लगाएं और पहचानें, जिससे जीडीपीआर अनुपालन सुनिश्चित करना और संवेदनशील जानकारी को अधिक प्रभावी ढंग से प्रबंधित करना आसान हो जाए। छवियों को खोजने से स्वचालित वर्कफ़्लोज़ बनाने और हस्ताक्षरित अनुबंधों और चालान प्राप्त करने पर विभिन्न व्यावसायिक प्रक्रियाओं को सुव्यवस्थित करने की अनुमति मिलती है।

छवियों में पाठ के लिए खोज - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

एलएलएम के साथ एआई पोस्टप्रोसेसिंग

अब आप कच्ची मान्यता से परे जा सकते हैं और OCR परिणामों की पाठ्य गुणवत्ता में सुधार करने के लिए AI- चालित तर्क को लागू कर सकते हैं। बड़ी भाषा मॉडल (LLM) समझदारी से वर्तनी त्रुटियों को ठीक कर सकते हैं, शब्द सीमाओं को पुनर्स्थापित कर सकते हैं, व्याकरण नियमों को लागू कर सकते हैं, और संदर्भ के आधार पर पाठ को अनुकूलित कर सकते हैं-कुछ ऐसा जो सिंटैक्स-आधारित स्पेलचैकर्स नहीं कर सकता है।

यह पोस्टप्रोसेसिंग कदम कम गुणवत्ता वाले स्कैन, पृष्ठभूमि शोर के साथ फोटो, या बहुभाषी दस्तावेजों के लिए आदर्श है। आप किसी भी LLM पाइपलाइन में प्लग कर सकते हैं जो बुनियादी पाठ इनपुट/आउटपुट का समर्थन करता है, या उत्पादन-तैयार परिणाम प्राप्त करने के लिए Aspose के अंतर्निहित स्मार्ट सुधार टूल का उपयोग करता है।

🧠ai पोस्टप्रोसेसिंग के साथ एलएलएम - सी#

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();