.NET अनुप्रयोगों के लिए C# OCR लाइब्रेरी
C# OCR में छवि को टेक्स्ट में बदलें
अधिक शोकेस >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Aspose OCR लाइब्रेरी क्यों चुनें?
कुछ ही सेकंड में अपने .NET ऐप्स में शक्तिशाली OCR क्षमताएँ बनाएँ। हमारा उपयोग में आसान ओसीआर एपीआई आपको छवियों और स्कैन से टेक्स्ट निकालने, खोजने योग्य पीडीएफ बनाने और न्यूनतम सी # कोड के साथ और भी बहुत कुछ करने की सुविधा देता है। .NET डेस्कटॉप, वेब, क्लाउड और सर्वर रहित कार्यों के लिए आदर्श। हमारी सुविधाओं और लाभों के बारे में अधिक जानने के लिए नीचे दिए गए आइटम पर क्लिक करें।

वैश्विक ओसीआर अनुप्रयोग
C# OCR अंग्रेजी, सिरिलिक, अरबी, फ़ारसी, चीनी, जापानी, कोरियाई, हिंदी, तमिल और मिश्रित भाषा के ग्रंथों को पहचानता है।
सब कुछ पढ़ें
स्कैनर या कैमरे के माध्यम से प्राप्त किसी भी फ़ाइल से टेक्स्ट प्राप्त करें, और सीधे वेब लिंक से छवियों को संसाधित करें।
विश्वसनीय परिणाम
सभी छवियों के लिए उच्च पहचान सटीकता प्राप्त करें, जिनमें फोकस से बाहर, घूमी हुई, विकृत और शोर वाली छवियां भी शामिल हैं।
बैच पहचान
फ़ोल्डरों और संग्रहों से सभी छवियों को थोक में पहचानें; बहु-पृष्ठ पीडीएफ दस्तावेज़ और टीआईएफएफ छवियां पढ़ें।
लेआउट का पता लगाना
लेआउट की परवाह किए बिना, निकाले गए टेक्स्ट का सही क्रम सुनिश्चित करने के लिए छवियों में सामग्री ब्लॉक को पहचानें और वर्गीकृत करें।
लाइव कोड नमूना
Aspose OCR API के साथ .NET OCR एक तुच्छ और सीधा कार्य बन जाता है, यहां तक कि नए डेवलपर्स के लिए भी। किसी छवि से टेक्स्ट निकालने और उसे स्क्रीन पर प्रदर्शित करने के लिए कोड की बस कुछ पंक्तियाँ ही पर्याप्त हैं। यह सचमुच बहुत आसान है - इसे आज़माएं।
* अपनी फ़ाइलें अपलोड करके या सेवा का उपयोग करके आप हमारी बात से सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.
छवि को टेक्स्ट में बदलें
और ज्यादा उदाहरण >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
मंच की स्वतंत्रता
क्रॉस-प्लेटफ़ॉर्म OCR लाइब्रेरी .NET, .NET कोर या .NET फ्रेमवर्क के तहत हर जगह काम कर सकती है - चाहे स्थानीय मशीन पर, वेब सर्वर, या क्लाउड में।
समर्थित फ़ाइल स्वरूप
Aspose.OCR for .NET किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/net/supported-file-formats/ ) आप स्कैनर या कैमरे से प्राप्त कर सकते हैं। पहचान परिणामों को सहेजा जा सकता है, डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।
इमेजिस
- JPEG
- PNG
- TIFF
- BMP
- GIF
बैच ओसीआर
- Multi-page PDF
- DjVu
- ZIP
- Folder
मान्यता परिणाम
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
किसी भी सामग्री के लिए उपयुक्त
C# में टेक्स्ट पहचान की सटीकता और विश्वसनीयता काफी हद तक छवि गुणवत्ता पर निर्भर करती है। .NET OCR बेहतर पहचान परिणाम सुनिश्चित करते हुए स्वचालित और मैन्युअल छवि अनुकूलन का एक पूरा सेट प्रदान करता है।
शक्तिशाली छवि प्रसंस्करण, पूरी तरह से अनुकूलन योग्य पाठ पहचान, पोस्ट-प्रोसेसिंग और स्वचालित वर्तनी सुधार उच्चतम सटीकता के साथ किसी भी स्कैन या फोटो से पाठ निष्कर्षण को सक्षम करते हैं।
ओसीआर संसाधन अनुकूलन
Aspose की C# OCR लाइब्रेरी प्रत्येक विशिष्ट उपयोग के मामले के लिए पहचान की गति, गुणवत्ता और संसाधन उपयोग के अत्यधिक लचीले संतुलन को सक्षम बनाती है:
- संपूर्ण पहचान और तीव्र पहचान के बीच चयन करें।
- पहचान के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या हमारी .NET OCR लाइब्रेरी को प्रोसेसर कोर की संख्या को स्वचालित रूप से स्केल करने की अनुमति दें।
- गणनाओं को GPU पर लोड करके CPU को मुक्त करें।
140+ मान्यता भाषाएँ
हमारी C# OCR लाइब्रेरी वैश्विक स्तर पर दस्तावेज़ प्रसंस्करण, डेटा निष्कर्षण और सामग्री डिजिटलीकरण के लिए एक सार्वभौमिक समाधान है। यूरोपीय, मध्य-पूर्व और एशियाई लेखन लिपियों की एक विशाल श्रृंखला के समर्थन के साथ, यह किसी भी देश और व्यवसाय के लिए अच्छी तरह से अनुकूलित है।
आप चीनी/अंग्रेज़ी, अरबी/फ़्रेंच या सिरिलिक/अंग्रेज़ी जैसी मिश्रित भाषाओं में लिखे गए दस्तावेज़ों को पहचान सकते हैं। निम्नलिखित भाषाएँ समर्थित हैं:
- विस्तारित लैटिन: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश और 80+ अधिक;
- सिरिलिक वर्णमाला: रूसी, यूक्रेनी, कज़ाख, बल्गेरियाई, मिश्रित सिरिलिक/अंग्रेजी पाठ सहित;
- अरबी, फ़ारसी, उर्दू, अंग्रेजी के साथ मिश्रित ग्रंथों सहित;
- चीनी, कोरियाई, जापानी, देवनागरी और द्रविड़ भाषाएँ, जिनमें हिंदी, तमिल, मराठी और अन्य शामिल हैं।
विशेषताएँ एवं क्षमताएँ
C# OCR स्वचालित रूप से फ़ोटो या स्कैन से टेक्स्ट निकालता है, जिससे दस्तावेज़ों को मैन्युअल रूप से पुनः टाइप करने की आवश्यकता समाप्त हो जाती है।
फोटो ओसीआर
स्कैन-स्तरीय सटीकता के साथ स्मार्टफ़ोन फ़ोटो से टेक्स्ट निकालें।
खोजने योग्य पीडीएफ
किसी भी स्कैन को पूरी तरह से खोजने योग्य और अनुक्रमणिका योग्य दस्तावेज़ में परिवर्तित करें।
यूआरएल पहचान
किसी छवि को स्थानीय रूप से डाउनलोड किए बिना URL से पहचानें।
थोक मान्यता
बहु-पृष्ठ दस्तावेज़ों, फ़ोल्डरों और संग्रहों से सभी छवियां पढ़ें।
कोई भी फ़ॉन्ट और शैली
सभी लोकप्रिय टाइपफेस और शैलियों में टेक्स्ट को पहचानें और पहचानें।
उत्तम धुन पहचान
सर्वोत्तम पहचान परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।
बानान चेकर
गलत वर्तनी वाले शब्दों को स्वचालित रूप से ठीक करके परिणामों में सुधार करें।
छवियों में टेक्स्ट ढूंढें
छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति खोजें।
छवि पाठ की तुलना करें
केस और लेआउट की परवाह किए बिना, दो छवियों पर टेक्स्ट की तुलना करें।
ओसीआर का उपयोग करना आसान है
हमारे सी# ओसीआर एपीआई के साथ, आपको छवि को टेक्स्ट में बदलने, खोजने योग्य पीडीएफ बनाने, पहचान परिणामों को दस्तावेज़ में सहेजने और बहुत कुछ करने के लिए सी# कोड की केवल कुछ पंक्तियों की आवश्यकता है। हमारे OCR API को अपने .NET समाधानों में एकीकृत करने के तरीके को समझने के लिए कोड नमूनों का अन्वेषण करें।
इंस्टालेशन
आप कुछ प्रतिबंधों के साथ इंस्टॉलेशन के ठीक बाद .NET के लिए Aspose OCR का उपयोग शुरू कर सकते हैं। एक अस्थायी लाइसेंस 30 दिनों के लिए परीक्षण संस्करण की सभी सीमाओं को हटा देता है। पूरी तरह कार्यात्मक OCR एप्लिकेशन का निर्माण शुरू करने के लिए इसका उपयोग करें और बाद में .NET के लिए OCR खरीदने का अंतिम निर्णय लें।
किसी फ़ोटो से टेक्स्ट निकालें
जब लोग आमतौर पर ओसीआर (ऑप्टिकल कैरेक्टर रिकॉग्निशन) के बारे में सोचते हैं, तो पहला जुड़ाव अक्सर प्राथमिक कैप्चर डिवाइस के रूप में स्कैनर से होता है। इस एसोसिएशन के ऐतिहासिक कारण हैं और यह अभी भी कई संदर्भों में प्रचलित है, जो बेजोड़ गुणवत्ता के साथ भौतिक दस्तावेजों से मुद्रित पाठ को कैप्चर करने के लिए सुसंगत और नियंत्रित वातावरण प्रदान करता है। हालाँकि, स्कैनर एक विशेष उपकरण है जो हमेशा हाथ में नहीं होता है और इसे संचालित करने के लिए एक स्थिर कार्य केंद्र की आवश्यकता होती है। सौभाग्य से, आधुनिक दुनिया पारंपरिक स्कैनर का एक सुविधाजनक विकल्प प्रदान करती है - एक स्मार्टफोन कैमरा। स्मार्टफोन कैमरा प्रौद्योगिकी में प्रगति यह सुनिश्चित करती है कि एक प्रवेश स्तर का स्मार्टफोन भी ओसीआर-तैयार दस्तावेजों को कैप्चर करने के लिए पर्याप्त गुणवत्ता प्रदान करता है। और अंतर्निर्मित मेमोरी चलते-फिरते बड़ी मात्रा में दस्तावेज़ों, समाचार पत्रों, पुस्तकों, सड़क चिन्हों और अन्य पाठों को डिजिटल बनाना पहले से कहीं अधिक आसान बना देती है। उन तस्वीरों को मशीन-पठनीय टेक्स्ट में बदलने के लिए आपको बस सही तकनीक की आवश्यकता है।
हमारी C# OCR लाइब्रेरी विशेष रूप से सभी प्रकार की छवियों को आउट-ऑफ़-द-बॉक्स पहचानने के लिए डिज़ाइन की गई है और निम्न-गुणवत्ता वाली तस्वीरों को भी संभालने के लिए इसे और बेहतर बनाया जा सकता है। एक आधुनिक स्मार्टफोन के साथ मिलकर, यह आपको अधिकांश रोजमर्रा की स्कैनिंग और टेक्स्ट पहचान कार्यों के लिए शक्तिशाली ओसीआर एप्लिकेशन बनाने की अनुमति देता है। सबसे उन्नत छवि प्रसंस्करण और दस्तावेज़ संरचना विश्लेषण कोड की कुछ पंक्तियों में किया जाता है, जिससे आप जटिल गणितीय एल्गोरिदम, तंत्रिका नेटवर्क और अन्य तकनीकी पेचीदगियों के बजाय व्यवसाय पर ध्यान केंद्रित कर सकते हैं।
फोटो ओसीआर - सी#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
स्कैन से खोजने योग्य पीडीएफ बनाएं
पीडीएफ कागजी दस्तावेज़ों को स्कैन करने के लिए सबसे लोकप्रिय प्रारूपों में से एक है, विशेष रूप से कई पृष्ठों को एक फ़ाइल में संयोजित करने की इसकी क्षमता के कारण। इस प्रारूप का व्यापक रूप से व्यक्तियों, व्यवसायों, बैंकों और सरकारी एजेंसियों के बीच अनुबंधों, चालानों, कानूनी दस्तावेजों, पासपोर्ट और आईडी कार्ड और कई अन्य दस्तावेजों के आदान-प्रदान के लिए उपयोग किया जाता है। हालाँकि, कोई भी स्कैन की गई पीडीएफ मूलतः छवियों का एक संग्रह है। इसमें मशीन-पठनीय पाठ नहीं है, इसलिए उपयोगकर्ता दस्तावेज़ सामग्री को खोज, कॉपी या अन्यथा हेरफेर नहीं कर सकते हैं।
Aspose .NET OCR आपको किसी भी स्कैन किए गए पीडीएफ को पूरी तरह से खोजने योग्य और अनुक्रमित करने योग्य दस्तावेज़ में परिवर्तित करने का एक तेज़, आसान और अत्यधिक विश्वसनीय तरीका प्रदान करता है। यह पृष्ठ सामग्री को सटीक रूप से पहचानता है, इसे मूल छवि पर मशीन-पठनीय टेक्स्ट परत में परिवर्तित करता है जिसे चुना जा सकता है, कॉपी किया जा सकता है, टेक्स्ट-टू-स्पीच सॉफ़्टवेयर द्वारा पढ़ा जा सकता है, और यहां तक कि अनुवादकों, सारांशकर्ताओं और अन्य एआई-संचालित एनालिटिक्स द्वारा स्वचालित रूप से संसाधित किया जा सकता है। औजार।
पीडीएफ में टेक्स्ट ओवरले जोड़ें - सी#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
छवियों में पाठ खोजें
डिजिटल अभिलेखागार, विशेष रूप से बड़े संगठनों में, अक्सर स्कैन और फ़ोटो का एक विशाल संग्रह होता है, जिनमें से कई में बहु-पृष्ठ दस्तावेज़ हो सकते हैं। आसान सूचना पुनर्प्राप्ति और नेविगेशन के लिए ऐसे अभिलेखों का प्रभावी प्रबंधन और संगठन आवश्यक है। हालाँकि, छवियों में मशीन-पठनीय पाठ नहीं होता है, जिससे दस्तावेज़ सामग्री को खोजना और उसका विश्लेषण करना असंभव हो जाता है।
C# OCR लाइब्रेरी आपको फ़ॉन्ट, टेक्स्ट आकार, शैली और अन्य मापदंडों की परवाह किए बिना छवियों में टेक्स्ट को आसानी से खोजने की अनुमति देती है। लाइब्रेरी केस-असंवेदनशील खोजों और नियमित अभिव्यक्तियों का भी समर्थन करती है, जो विभिन्न अनुप्रयोगों और उद्योगों में बेहद उपयोगी हैं। इस कार्यक्षमता का उपयोग पाठ में पाई गई सामग्री, कीवर्ड या पैटर्न के आधार पर दस्तावेज़ों को वर्गीकृत करने के लिए किया जा सकता है; समझौतों और अनुबंधों के भीतर विशिष्ट शर्तों या खंडों की खोज करना; कीवर्ड या उनमें पाई गई सामग्री के आधार पर फ़ाइलों को पुनर्व्यवस्थित करना; दस्तावेज़ों के भीतर व्यक्तिगत डेटा का पता लगाना और उसकी पहचान करना, जिससे जीडीपीआर अनुपालन सुनिश्चित करना और संवेदनशील जानकारी को अधिक प्रभावी ढंग से प्रबंधित करना आसान हो जाता है। छवियों के साथ खोज करने से स्वचालित वर्कफ़्लो बनाने और हस्ताक्षरित अनुबंध और चालान प्राप्त करने पर विभिन्न व्यावसायिक प्रक्रियाओं को सुव्यवस्थित करने की भी अनुमति मिलती है।
छवियों में पाठ खोजें - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}