.NET अनुप्रयोगों के लिए AI संचालित C# OCR लाइब्रेरी
C# OCR में पाठ में छवि को परिवर्तित करें
अधिक शोकेस >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
     = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Aspose OCR लाइब्रेरी क्यों चुनें?
सेकंड में अपने .NET ऐप्स में शक्तिशाली OCR क्षमताओं का निर्माण करें। हमारा आसानी से उपयोग करने वाला OCR API आपको छवियों और स्कैन से पाठ निकालने, खोजने योग्य PDFs बनाने, और अधिक से अधिक C# कोड के साथ अधिक बनाता है। .NET डेस्कटॉप, वेब, क्लाउड और सर्वर रहित कार्यों के लिए आदर्श।
OCR का अनुभव करें जो केवल पाठ को नहीं निकालता है, लेकिन इसे AI के साथ समझता है और बढ़ाता है। हमारी सुविधाओं और लाभों के बारे में अधिक जानने के लिए नीचे दिए गए आइटम पर क्लिक करें।

वैश्विक ओसीआर अनुप्रयोग
C# OCR अंग्रेजी, सिरिलिक, अरबी, फारसी, चीनी, जापानी, कोरियाई, हिंदी, तमिल और मिश्रित भाषा के ग्रंथों को मान्यता देता है।
सब कुछ पढ़ें
स्कैनर या कैमरे के माध्यम से प्राप्त किसी भी फ़ाइल से पाठ प्राप्त करें, और सीधे वेब लिंक से छवियों को संसाधित करें।
विश्वसनीय परिणाम
सभी छवियों के लिए उच्च मान्यता सटीकता प्राप्त करें, जिनमें वे शामिल हैं, जो बाहर-फोकस, घुमाए गए, विकृत और शोर हैं।
बैच मान्यता
फोल्डर और अभिलेखागार से सभी छवियों को मान्यता दें; मल्टी-पेज पीडीएफ दस्तावेज़ और टीआईएफएफ छवियों को पढ़ें।
लेआउट का पता लगाना
लेआउट की परवाह किए बिना निकाले गए पाठ के सही क्रम को सुनिश्चित करने के लिए छवियों में सामग्री ब्लॉक को पहचानें और वर्गीकृत करें।
एलएलएम का उपयोग करके एआई पोस्टप्रोसेसिंग
न केवल OCR-होशियार, त्रुटि-मुक्त पाठ मान्यता के लिए आपका ऑल-इन-वन एआई समाधान। Aspose.ocr अब AI और LLMS को उन मॉडलों को चुनने के लिए एकीकृत करता है जो OCR सटीकता को बढ़ाते हैं - फिक्सिंग त्रुटियों, लापता पाठ को पुनर्स्थापित करना और समग्र मान्यता गुणवत्ता में सुधार करना।
लाइव कोड नमूना
.NET OCR नए डेवलपर्स के लिए भी, OCR API के साथ एक तुच्छ और सीधा कार्य बन जाता है। कोड की बस कुछ पंक्तियाँ एक छवि से पाठ निकालने और इसे स्क्रीन पर प्रदर्शित करने के लिए पर्याप्त हैं। यह वास्तव में इतना सरल है - इसे आज़माएं।
* अपनी फ़ाइलों को अपलोड करके या उस सेवा का उपयोग करके आप हमारे साथ सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.
छवि को पाठ में परिवर्तित करें
और ज्यादा उदाहरण >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
प्लेटफ़ॉर्म स्वतंत्रता
Cross-Platform OCR लाइब्रेरी .NET, .NET कोर या .NET फ्रेमवर्क के तहत हर जगह काम कर सकती है-चाहे वह स्थानीय मशीन पर हो, वेब सर्वर पर, या क्लाउड में।
समर्थित फ़ाइल स्वरूप
Aspose.OCR for .NET किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/net/supported-file-formats/ ) आप एक स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणामों को सहेजा जा सकता है, एक डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।
इमेजिस
- JPEG
 - PNG
 - TIFF
 - BMP
 - GIF
 
बैच ओसीआर
- Multi-page PDF
 - DjVu
 - ZIP
 - Folder
 
मान्यता परिणाम
- Text
 - Microsoft Word
 - Microsoft Excel
 - HTML
 - RTF
 - ePub
 - JSON
 - XML
 
LLM- संचालित OCR: AI भाषा मॉडल द्वारा संचालित OCR की अगली पीढ़ी।
परिणाम सटीकता मान्यता पर नहीं रुकती है - बाहरी एलएलएम का उपयोग करके पाठ को परिष्कृत करके गुणवत्ता के अगले स्तर को अनलॉक करें।
- मान्यता प्राप्त पाठ में स्वचालित रूप से वर्तनी और व्याकरण को सही करें।
 - मल्टी-पेज स्कैन में विसंगतियों और स्वरूपण मुद्दों को सामान्य करें।
 - त्वरित-संचालित मॉडल का उपयोग करके विषय-विशिष्ट शब्दावली के लिए मान्यता परिणामों को अनुकूलित करें।
 - किसी भी बाहरी एलएलएम पाइपलाइन को अपने OCR वर्कफ़्लो में कोड की कुछ पंक्तियों के साथ एकीकृत करें।
 
किसी भी सामग्री के लिए उपयुक्त
C# में पाठ मान्यता की सटीकता और विश्वसनीयता काफी हद तक छवि गुणवत्ता पर निर्भर करती है। .NET OCR बेहतर मान्यता परिणाम सुनिश्चित करने के लिए स्वचालित और मैनुअल छवि अनुकूलन का एक पूरा सेट प्रदान करता है।
शक्तिशाली छवि प्रसंस्करण, पूरी तरह से अनुकूलन योग्य पाठ का पता लगाने, पोस्ट-प्रोसेसिंग, और स्वचालित वर्तनी सुधार किसी भी स्कैन या उच्चतम सटीकता के साथ किसी भी स्कैन या फोटो से पाठ निष्कर्षण को सक्षम करते हैं।
OCR संसाधन अनुकूलन
Aspose ‘C# OCR लाइब्रेरी प्रत्येक विशिष्ट उपयोग के मामले के लिए मान्यता गति, गुणवत्ता और संसाधन उपयोग के अत्यधिक लचीले संतुलन को सक्षम करती है:
- पूरी तरह से मान्यता और तेजी से मान्यता के बीच चुनें।
 - मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या हमारे .NET OCR लाइब्रेरी को प्रोसेसर कोर की संख्या के लिए स्वचालित रूप से स्केल करने की अनुमति दें।
 - GPU को गणना को बंद करके CPU को मुक्त करें।
 
140+ मान्यता भाषाएँ
हमारी C# OCR लाइब्रेरी वैश्विक स्तर पर दस्तावेज़ प्रसंस्करण, डेटा निष्कर्षण और सामग्री डिजिटलीकरण के लिए एक सार्वभौमिक समाधान है। यूरोपीय, मध्य-पूर्व और एशियाई लेखन स्क्रिप्ट के एक विशाल सरणी के लिए समर्थन के साथ, यह किसी भी देश और व्यवसाय के लिए अच्छी तरह से अनुकूलित है।
आप मिश्रित भाषाओं में लिखे गए दस्तावेजों को पहचान सकते हैं, जैसे कि चीनी/अंग्रेजी, अरबी/फ्रेंच या सिरिलिक/अंग्रेजी। निम्नलिखित भाषाओं का समर्थन किया जाता है:
- ** विस्तारित लैटिन **: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
 - ** सिरिलिक ** वर्णमाला: रूसी, यूक्रेनी, कजाख, बल्गेरियाई, मिश्रित सिरिलिक/अंग्रेजी ग्रंथों सहित;
 - अरबी, फारसी, उर्दू, अंग्रेजी के साथ मिश्रित ग्रंथों सहित;
 - चीनी, कोरियाई, जापानी, देवनागरी और द्रविड़ियन भाषाएं, जिनमें हिंदी, तमिल, मराठी और अन्य शामिल हैं।
 
सुविधाएँ और क्षमता
C# OCR स्वचालित रूप से फ़ोटो या स्कैन से पाठ निकालता है, दस्तावेजों के मैनुअल रिटाइपिंग की आवश्यकता को समाप्त करता है।
फोटो ओसीआर
स्कैन-स्तरीय सटीकता के साथ स्मार्टफोन तस्वीरों से पाठ निकालें।
खोज योग्य पीडीएफ
किसी भी स्कैन को पूरी तरह से खोजा और सूचकांक योग्य दस्तावेज़ में बदलें।
URL मान्यता
स्थानीय रूप से डाउनलोड किए बिना URL से एक छवि को पहचानें।
थोक मान्यता
बहु-पृष्ठ दस्तावेज़, फ़ोल्डर और अभिलेखागार से सभी चित्र पढ़ें।
कोई भी फ़ॉन्ट और शैली
सभी लोकप्रिय टाइपफेस और शैलियों में पाठ को पहचानें और पहचानें।
ठीक धुन मान्यता
सर्वोत्तम मान्यता परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।
बानान चेकर
गलत शब्दों को स्वचालित रूप से सही करके परिणामों में सुधार करें।
छवियों में पाठ खोजें
छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति के लिए खोजें।
छवि ग्रंथों की तुलना करें
मामले और लेआउट की परवाह किए बिना, दो छवियों पर ग्रंथों की तुलना करें।
एआई संचालित सुधार
ट्रांसफॉर्मर-आधारित एलएलएमएस का उपयोग करके गलत तरीके से मान्यता प्राप्त शब्दों और व्याकरण को ठीक करें-कोई कस्टम प्रशिक्षण की आवश्यकता नहीं है।
सिमेंटिक पोस्टप्रोसेसिंग
वर्णों से परे जाएं: बेहतर सामग्री की गुणवत्ता और भाषा सामान्यीकरण के लिए एलएलएम के साथ शोर ओसीआर आउटपुट को परिष्कृत करें।
प्लग-इन एलएलएम पाइपलाइन
OCR मान्यता गलतियों को ठीक करने और अपूर्ण या खंडित पाठ को पुनर्स्थापित करने के लिए बाहरी भाषा मॉडल कनेक्ट करें।
OCR का उपयोग करना आसान है
हमारे C# OCR API के साथ, आपको केवल C# कोड की कुछ पंक्तियों की आवश्यकता है ताकि छवि को पाठ में परिवर्तित किया जा सके, एक खोज योग्य PDF बनाएं, दस्तावेज़ में मान्यता परिणाम सहेजें, और कई और अधिक। हमारे OCR API को अपने .NET समाधानों में कैसे एकीकृत करें, यह समझने के लिए कोड नमूनों का अन्वेषण करें।
इंस्टालेशन
आप कुछ प्रतिबंधों के साथ स्थापना के बाद .NET के लिए Aspose OCR का उपयोग शुरू कर सकते हैं। एक अस्थायी लाइसेंस 30 दिनों के लिए परीक्षण संस्करण की सभी सीमाओं को हटा देता है। एक पूरी तरह कार्यात्मक OCR एप्लिकेशन का निर्माण शुरू करने के लिए इसका उपयोग करें और बाद में .NET के लिए OCR खरीदने के लिए अंतिम निर्णय लें।
एक तस्वीर से पाठ निकालें
जब लोग आमतौर पर OCR (ऑप्टिकल चरित्र मान्यता) के बारे में सोचते हैं, तो पहला एसोसिएशन अक्सर प्राथमिक कैप्चर डिवाइस के रूप में एक स्कैनर के साथ होता है। इस एसोसिएशन के ऐतिहासिक कारण हैं और अभी भी कई संदर्भों में प्रचलित है, जो बेजोड़ गुणवत्ता के साथ भौतिक दस्तावेजों से मुद्रित पाठ को कैप्चर करने के लिए सुसंगत और नियंत्रित वातावरण प्रदान करता है। हालांकि, एक स्कैनर विशेष उपकरण है जो हमेशा हाथ में नहीं होता है और इसे संचालित करने के लिए एक स्थिर वर्कस्टेशन की आवश्यकता होती है। सौभाग्य से, आधुनिक दुनिया पारंपरिक स्कैनर के लिए एक सुविधाजनक विकल्प प्रदान करती है - एक स्मार्टफोन कैमरा। स्मार्टफोन कैमरा तकनीक में प्रगति यह सुनिश्चित करती है कि यहां तक कि एक एंट्री-लेवल स्मार्टफोन भी OCR- तैयार दस्तावेजों को कैप्चर करने के लिए पर्याप्त गुणवत्ता प्रदान करता है। और अंतर्निहित मेमोरी बड़ी मात्रा में दस्तावेजों, समाचार पत्रों, पुस्तकों, सड़क के संकेतों और अन्य पाठ को डिजिटाइज़ करने के लिए पहले से कहीं अधिक आसान बनाती है। आपको उन तस्वीरों को मशीन-पठनीय पाठ में बदलने के लिए सही तकनीक की आवश्यकता है।
हमारी C# OCR लाइब्रेरी को विशेष रूप से सभी प्रकार की छवियों को आउट-ऑफ-द-बॉक्स को पहचानने के लिए डिज़ाइन किया गया है और यहां तक कि कम गुणवत्ता वाली तस्वीरों को भी संभालने के लिए ठीक-ठीक ट्यून किया जा सकता है। एक आधुनिक स्मार्टफोन के साथ संयुक्त, यह आपको अधिकांश रोजमर्रा की स्कैनिंग और पाठ मान्यता कार्यों के लिए शक्तिशाली OCR एप्लिकेशन बनाने की अनुमति देता है। सबसे उन्नत छवि प्रसंस्करण और दस्तावेज़ संरचना विश्लेषण कोड की कुछ पंक्तियों में किया जाता है, जिससे आप जटिल गणितीय एल्गोरिदम, तंत्रिका नेटवर्क और अन्य तकनीकी पेचीदगियों के बजाय व्यवसाय पर ध्यान केंद्रित कर सकते हैं।
फोटो ओसीआर - सी#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
स्कैन से एक खोज योग्य पीडीएफ बनाएं
पीडीएफ पेपर दस्तावेजों को स्कैन करने के लिए सबसे लोकप्रिय प्रारूपों में से एक है, विशेष रूप से एक ही फ़ाइल में कई पृष्ठों को संयोजित करने की क्षमता के कारण। यह प्रारूप व्यापक रूप से अनुबंध, चालान, कानूनी दस्तावेज, पासपोर्ट और आईडी कार्ड, और व्यक्तियों, व्यवसायों, बैंकों और सरकारी एजेंसियों के बीच कई अन्य दस्तावेजों के आदान -प्रदान के लिए उपयोग किया जाता है। हालांकि, किसी भी स्कैन किए गए पीडीएफ अनिवार्य रूप से छवियों का एक संग्रह है। इसमें मशीन-पठनीय पाठ नहीं है, इसलिए उपयोगकर्ता दस्तावेज़ सामग्री को खोज, कॉपी या अन्यथा हेरफेर नहीं कर सकते हैं।
aspose .net ocr आपको किसी भी स्कैन किए गए पीडीएफ को पूरी तरह से खोजा और अनुक्रमित दस्तावेज़ में परिवर्तित करने के लिए एक तेज, आसान और अत्यधिक विश्वसनीय तरीका प्रदान करता है। यह पृष्ठ सामग्री को सही ढंग से पहचानता है, इसे मूल छवि पर एक मशीन-पठनीय पाठ परत में परिवर्तित करता है जिसे चुना जा सकता है, कॉपी किया जा सकता है, पाठ-से-स्पीच सॉफ़्टवेयर द्वारा पढ़ा जा सकता है, और यहां तक कि स्वचालित रूप से अनुवादक, समर, और अन्य एआई-संचालित एनालिटिक्स टूल द्वारा संसाधित किया जा सकता है।
PDF में टेक्स्ट ओवरले जोड़ें - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
छवियों में पाठ के लिए खोजें
डिजिटल अभिलेखागार, विशेष रूप से बड़े संगठनों में, अक्सर स्कैन और फ़ोटो का एक विशाल संग्रह होता है, जिनमें से कई में बहु-पृष्ठ दस्तावेज़ हो सकते हैं। इस तरह के अभिलेखागार का कुशल प्रबंधन और संगठन प्रभावी रूप से आसान सूचना पुनर्प्राप्ति और नेविगेशन के लिए आवश्यक है। हालांकि, छवियों में मशीन-पठनीय पाठ नहीं होता है, जिससे दस्तावेज़ सामग्री को खोज और विश्लेषण करना असंभव हो जाता है।
C# OCR लाइब्रेरी आपको फ़ॉन्ट, टेक्स्ट आकार, स्टाइल और अन्य मापदंडों की परवाह किए बिना आसानी से छवियों में पाठ की खोज करने की अनुमति देती है। पुस्तकालय केस-असंवेदनशील खोजों और नियमित अभिव्यक्तियों का भी समर्थन करता है, जो विभिन्न अनुप्रयोगों और उद्योगों में बेहद उपयोगी हैं। इस कार्यक्षमता का उपयोग पाठ में पाए गए सामग्री, कीवर्ड, या पैटर्न के आधार पर दस्तावेजों को वर्गीकृत करने के लिए किया जा सकता है; समझौतों और अनुबंधों के भीतर विशिष्ट शर्तों या खंडों की खोज; उनके भीतर पाए जाने वाले कीवर्ड या सामग्री के आधार पर फ़ाइलों को पुनर्गठित करना; दस्तावेजों के भीतर व्यक्तिगत डेटा का पता लगाएं और पहचानें, जिससे जीडीपीआर अनुपालन सुनिश्चित करना और संवेदनशील जानकारी को अधिक प्रभावी ढंग से प्रबंधित करना आसान हो जाए। छवियों को खोजने से स्वचालित वर्कफ़्लोज़ बनाने और हस्ताक्षरित अनुबंधों और चालान प्राप्त करने पर विभिन्न व्यावसायिक प्रक्रियाओं को सुव्यवस्थित करने की अनुमति मिलती है।
छवियों में पाठ के लिए खोज - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}
एलएलएम के साथ एआई पोस्टप्रोसेसिंग
अब आप कच्ची मान्यता से परे जा सकते हैं और OCR परिणामों की पाठ्य गुणवत्ता में सुधार करने के लिए AI- चालित तर्क को लागू कर सकते हैं। बड़ी भाषा मॉडल (LLM) समझदारी से वर्तनी त्रुटियों को ठीक कर सकते हैं, शब्द सीमाओं को पुनर्स्थापित कर सकते हैं, व्याकरण नियमों को लागू कर सकते हैं, और संदर्भ के आधार पर पाठ को अनुकूलित कर सकते हैं-कुछ ऐसा जो सिंटैक्स-आधारित स्पेलचैकर्स नहीं कर सकता है।
यह पोस्टप्रोसेसिंग कदम कम गुणवत्ता वाले स्कैन, पृष्ठभूमि शोर के साथ फोटो, या बहुभाषी दस्तावेजों के लिए आदर्श है। आप किसी भी LLM पाइपलाइन में प्लग कर सकते हैं जो बुनियादी पाठ इनपुट/आउटपुट का समर्थन करता है, या उत्पादन-तैयार परिणाम प्राप्त करने के लिए Aspose के अंतर्निहित स्मार्ट सुधार टूल का उपयोग करता है।
🧠ai पोस्टप्रोसेसिंग के साथ एलएलएम - सी#
// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();
// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};
// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);
// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());
// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);
// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);
// Release resources
aiEngine.Dispose();