Aspose.OCR  for .NET

छवियों और PDF को .NET में टेक्स्ट में बदलें

कोड की कुछ पंक्तियों के साथ अपने .NET अनुप्रयोगों में ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) जोड़ें।

  Download Free Trial
  
 

.NET के लिए Aspose.OCR ऑप्टिकल कैरेक्टर रिकग्निशन के लिए एक शक्तिशाली लेकिन उपयोग में आसान और लागत प्रभावी एपीआई है। इसके साथ, आप जटिल गणित, तंत्रिका नेटवर्क और अन्य तकनीकी विवरणों की चिंता किए बिना कोड की 5 से कम पंक्तियों में अपने .NET अनुप्रयोगों में OCR कार्यक्षमता जोड़ सकते हैं। मशीन लर्निंग प्रौद्योगिकियों और विकास के वर्षों में हमारे अनुभव के परिणामस्वरूप बेहतर गति और सटीकता के साथ एक ओसीआर इंजन मिला है जो लैटिन और सिरिलिक स्क्रिप्स के साथ-साथ चीनी पर आधारित 26 भाषाओं का समर्थन करता है। ओसीआर एपीआई स्कैन की गई छवियों, स्मार्टफोन फोटो, स्क्रीनशॉट, छवियों के क्षेत्रों और स्कैन किए गए पीडीएफ को पहचान सकता है और सबसे लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में परिणाम लौटा सकता है। विभिन्न प्री-प्रोसेसिंग फ़िल्टर आपको घुमाए गए, तिरछी और शोर वाली छवियों को पहचानने की अनुमति देते हैं। संसाधन गहन कम्प्यूटेशनल कार्यों को GPU में स्थानांतरित करके मान्यता प्रदर्शन और सिस्टम लोड को और बेहतर बनाया जा सकता है।

.NET के लिए Aspose.OCR की विशेषताएं और क्षमताएं

छवियों और PDF को टेक्स्ट में कनवर्ट करता है

सभी छवि प्रारूपों का समर्थन करता है जिन्हें आप स्कैनर या कैमरा के रूप में प्राप्त कर सकते हैं

लैटिन और सिरिलिक पर आधारित भाषाओं को पढ़ता है

6,000 से अधिक चीनी अक्षरों को पहचानता है

सभी लोकप्रिय टाइपफेस का पता लगाता है और पहचानता है

फ़ॉन्ट शैलियों और स्वरूपण को सावधानीपूर्वक संरक्षित करता है

पूरी छवि या केवल चयनित क्षेत्रों को संसाधित करता है

घुमावदार, तिरछी और शोर छवियों का समर्थन करता है

किसी फ़ोल्डर या संग्रह में सभी छवियों की बैच पहचान

वेब लिंक के रूप में प्रदान की गई छवियों को पहचानता है

गलत वर्तनी वाले शब्दों को ढूंढता है और स्वचालित रूप से सुधारता है

अन्य Aspose उत्पादों के साथ पूरी तरह से संगत

इन्सटाल करना आसान

.NET के लिए Aspose.OCR को हल्के NuGet पैकेज के रूप में या न्यूनतम निर्भरता वाली डाउनलोड करने योग्य फ़ाइल के रूप में वितरित किया जाता है। बस इसे अपने प्रोजेक्ट में इंस्टॉल करें और आप किसी भी समर्थित भाषाओं में टेक्स्ट को पहचानने और किसी भी समर्थित प्रारूप में मान्यता परिणामों को सहेजने के लिए तैयार हैं।

बिना किसी सीमा और प्रतिबंध के पूरी तरह कार्यात्मक ओसीआर एप्लिकेशन का निर्माण शुरू करने के लिए एक अस्थायी लाइसेंस का अनुरोध करें।

प्रयोग करने में आसान

छवि को पहचानने और परिणाम प्रदर्शित करने के लिए आपको कोड की तीन पंक्तियों की आवश्यकता है। हाँ, यह वास्तव में इतना आसान है!

3 पंक्तियों में पाठ के लिए छवि - सी #

// OCR इंजन को इनिशियलाइज़ करें
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// पाठ के लिए छवि को पहचानें
string result = recognitionEngine.RecognizeImage("sample.jpg");

// मान्यता परिणाम प्रदर्शित करें
Console.WriteLine(result);

क्रॉस-प्लेटफॉर्म

पुस्तकालय पूरी तरह से .NET मानक 2.0 का समर्थन करता है। इसका मतलब है कि एप्लिकेशन किसी भी प्लेटफॉर्म पर चल सकते हैं: डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड।

26 मान्यता भाषाएँ

OCR API मिश्रित भाषाओं वाले टेक्स्ट सहित बड़ी संख्या में भाषाओं और सभी लोकप्रिय लेखन लिपियों को पहचान सकता है।

  • विस्तारित लैटिन वर्णमाला : क्रोएशियाई, चेक, डेनिश, डच, अंग्रेजी, एस्टोनियाई, फिनिश, फ्रेंच, जर्मन, इतालवी, लातवियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, पुर्तगाली, रोमानियाई, स्लोवाक, स्लोवेनियाई, स्पेनिश, स्वीडिश।
  • सिरिलिक वर्णमाला : बेलारूसी, बल्गेरियाई, कज़ाख, रूसी, सर्बियाई, यूक्रेनी।
  • चीनी : 6,000 से अधिक वर्ण।

आप भाषा की पहचान को पुस्तकालय पर छोड़ सकते हैं या पहचान के प्रदर्शन और विश्वसनीयता को बढ़ाने के लिए भाषा को स्वयं परिभाषित कर सकते हैं।

तस्वीरों को पहचानें

ओसीआर अनुप्रयोगों के लिए सबसे बड़ी बाधा यह है कि अंतिम उपयोगकर्ताओं के लिए स्कैनर सामान्य नहीं हैं। एपीआई में शक्तिशाली बिल्ट-इन इमेज प्री-प्रोसेसिंग फिल्टर हैं जो घुमाए गए, तिरछे और शोर वाली छवियों को संभाल सकते हैं। सभी छवि प्रारूपों के समर्थन के संयोजन में, यह स्मार्टफोन की तस्वीरों की भी विश्वसनीय पहचान की अनुमति देता है। अधिकांश पूर्व-प्रसंस्करण और छवि सुधार स्वचालित रूप से किया जाता है, इसलिए आपको केवल कठिन मामलों में ही हस्तक्षेप करना होगा।

स्वचालित छवि सुधार लागू करें - C#

// OCR इंजन को इनिशियलाइज़ करें
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// स्वचालित तिरछा गणना और कंट्रास्ट सक्षम करें
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// छवि को पहचानें
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

यूनिवर्सल कनवर्टर

एपीआई सचमुच किसी भी छवि को पढ़ सकता है जिसे आप स्कैनर, कैमरा या स्मार्टफोन से प्राप्त कर सकते हैं: पीडीएफ दस्तावेज़, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी छवियां, और यहां तक कि डीजेवी फाइलें भी। बहु-पृष्ठ PDF दस्तावेज़, TIFF और DjVu चित्र पूरी तरह से समर्थित हैं। आप URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।

मान्यता परिणाम सबसे लोकप्रिय दस्तावेज़ और डेटा विनिमय प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, जेएसओएन, और एक्सएमएल।

पीडीएफ को पहचानें और जेएसओएन में परिणाम सहेजें - सी #

// OCR इंजन को इनिशियलाइज़ करें
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// स्कैन किए गए PDF से सभी पृष्ठों को पहचानें
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// प्रत्येक पृष्ठ को JSON के रूप में आउटपुट करें
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

संसाधन अनुकूलन

ऑप्टिकल कैरेक्टर रिकग्निशन एक संसाधन-गहन प्रक्रिया है। एपीआई क्लासिक टाइम-प्राइस-क्वालिटी ट्रायड में संतुलन बनाने के लिए बहुत ही लचीले तरीके प्रदान करता है:

  • पूरी तरह से पहचान और तेजी से पहचान के बीच चयन करें।
  • मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या लाइब्रेरी को प्रोसेसर कोर की संख्या को स्वचालित रूप से स्केल करने की अनुमति दें।
  • गणनाओं को GPU पर लोड करके CPU को मुक्त करें।

तेजी से पहचान - सी #

// OCR इंजन को इनिशियलाइज़ करें
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// सबसे तेज़ मोड में छवि को पहचानें
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

वर्तनी की जाँच

जबकि ओसीआर विश्वसनीय परिणाम देता है, धूल और प्रिंट दोषों के कारण कुछ प्रतीकों को गलत तरीके से पहचाना जा सकता है। ओसीआर एपीआई में एक अंतर्निहित वर्तनी परीक्षक है जो स्वचालित रूप से गलत वर्तनी वाले शब्दों को बदल देता है और आपको पहचान परिणामों को मैन्युअल रूप से सही करने से मुक्त करता है।

वर्तनी जाँच मान्यता परिणाम - C#

// OCR इंजन को इनिशियलाइज़ करें
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// स्वचालित कंट्रास्ट सक्षम करें
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// छवि को पहचानें
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// सही गलत वर्तनी वाले शब्द
string text =  result.GetSpellCheckCorrectedText();

बैच प्रसंस्करण

OCR API आपको विभिन्न बैच-प्रोसेसिंग विधियों की पेशकश करके प्रत्येक छवि को एक-एक करके पहचानने से मुक्त करता है जो आपको एक कॉल में कई छवियों को पहचानने की अनुमति देता है:

  • बहु-पृष्ठ PDF, TIFF और DjVu फ़ाइलों की पहचान।
  • एक फ़ोल्डर में सभी फाइलों की पहचान।
  • एक संग्रह में सभी फाइलों की पहचान।
  • एक सूची से सभी फाइलों की पहचान।

उदाहरण के द्वारा जानें

.NET के लिए Aspose.OCR C# में लिखे गए कई उदाहरणों के साथ आता है जो आपको इसके कार्यों और क्षमताओं से खुद को जल्दी से परिचित कराने की अनुमति देता है और आपको अपनी व्यावसायिक आवश्यकताओं के लिए समाधान बनाने का एक विचार देता है।

  
  

Aspose अन्य लोकप्रिय प्रोग्रामिंग भाषाओं के लिए मूल OCR API भी प्रदान करता है: