OCR for C++

OCR for Python via .NET

OCR for Python via Java

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for .NET

.NET अनुप्रयोगों के लिए मूल OCR API

छवियों को आसानी से मशीन-पठनीय पाठ में बदलें और .NET कोड की कुछ पंक्तियों का उपयोग करके स्कैन किए गए पृष्ठों से खोजने योग्य पीडीएफ उत्पन्न करें।

डाउनलोड करना परीक्षण खरीदना

देखें, क्या नया है

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
     = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

> dotnet add package Aspose.OCR

.NET के लिए Aspose.OCR क्यों?

.NET के लिए Aspose.OCR ऑप्टिकल कैरेक्टर पहचान के लिए एक मजबूत, डेवलपर-अनुकूल और लागत प्रभावी एपीआई है। मूल C# कोड की 10 से कम पंक्तियों में, आप अपने .NET डेस्कटॉप समाधान, MVC-आधारित वेब एप्लिकेशन, क्लाउड सेवाओं और सर्वर रहित Azure फ़ंक्शंस में OCR क्षमताओं का निर्माण कर सकते हैं। स्कैन, फोटो और स्क्रीनशॉट से मशीन-पठनीय पाठ निकालें, स्कैन किए गए पृष्ठों को खोजने योग्य और अनुक्रमित करने योग्य पीडीएफ में परिवर्तित करें, जटिल गणित, तंत्रिका नेटवर्क और अन्य तकनीकी पेचीदगियों के बजाय व्यावसायिक कार्य पर ध्यान केंद्रित करने वाली छवियों पर पाठ ढूंढें और तुलना करें। हमारी सुविधाओं और लाभों के बारे में अधिक जानने के लिए नीचे दिए गए आइटम पर क्लिक करें।

वैश्विक अनुप्रयोग

6,000 से अधिक चीनी अक्षरों और हिंदी सहित लैटिन, सिरिलिक और एशियाई लिपियों में ग्रंथों को पहचानें।

सब कुछ पढ़ें

स्कैनर या कैमरे के माध्यम से प्राप्त किसी भी फ़ाइल से टेक्स्ट पुनर्प्राप्त करें, और सीधे वेब लिंक से छवियों को संसाधित करें।

विश्वसनीय परिणाम

सभी छवियों के लिए उच्च पहचान सटीकता प्राप्त करें, जिनमें फोकस से बाहर, घूमी हुई, विकृत और शोर वाली छवियां भी शामिल हैं।

बैच पहचान

फ़ोल्डरों और संग्रहों से सभी छवियों को थोक में पहचानें; बहु-पृष्ठ पीडीएफ दस्तावेज़ और टीआईएफएफ छवियां पढ़ें।

लेआउट का पता लगाना

लेआउट की परवाह किए बिना, निकाले गए टेक्स्ट का सही क्रम सुनिश्चित करने के लिए छवियों में सामग्री ब्लॉक को पहचानें और वर्गीकृत करें।

लाइव कोड नमूना

Aspose.OCR के साथ ऑप्टिकल कैरेक्टर पहचान एक मामूली और सीधा काम बन जाता है, यहां तक कि प्रौद्योगिकी में नए डेवलपर्स के लिए भी। किसी छवि से टेक्स्ट निकालने और उसे स्क्रीन पर प्रदर्शित करने के लिए कोड की बस कुछ पंक्तियाँ ही पर्याप्त हैं। यह सचमुच बहुत आसान है - इसे आज़माएं।

पहचानने को तैयार पहचानने को तैयार एक फ़ाइल यहां छोड़ें या ब्राउज़ करने के लिए क्लिक करें *

* अपनी फ़ाइलें अपलोड करके या सेवा का उपयोग करके आप हमारी बात से सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.

मान्यता परिणाम

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

मंच की स्वतंत्रता

.NET के लिए Aspose.OCR किसी भी प्लेटफ़ॉर्म पर काम कर सकता है जो .NET, .NET कोर या .NET फ्रेमवर्क का समर्थन करता है - चाहे स्थानीय पर हो मशीन, वेब सर्वर पर, या क्लाउड में।

समर्थित फ़ाइल स्वरूप

Aspose.OCR for .NET वस्तुतः किसी भी [फ़ाइल]के साथ काम कर सकता है( https://docs.aspose.com/ocr/net/supported-file-formats/ ) आप स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणाम सबसे लोकप्रिय फ़ाइल और डेटा विनिमय प्रारूपों में लौटाए जाते हैं जिन्हें सहेजा जा सकता है, डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।

इमेजिस

JPEG
PNG
TIFF
BMP
GIF

बैच ओसीआर

Multi-page PDF
DjVu
ZIP
Folder

मान्यता परिणाम

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

किसी भी सामग्री के लिए उपयुक्त

पाठ पहचान की सटीकता और विश्वसनीयता मूल छवि की गुणवत्ता पर अत्यधिक निर्भर है। .NET के लिए Aspose.OCR पूरी तरह से स्वचालित और मैन्युअल इमेज प्रोसेसिंग फिल्टर दोनों की एक विस्तृत श्रृंखला प्रदान करता है जो OCR इंजन में भेजे जाने से पहले एक छवि को बेहतर बनाता है।

शक्तिशाली छवि प्रसंस्करण और अनुकूलन योग्य सामग्री संरचना पहचान एल्गोरिदम उच्च-गुणवत्ता वाले स्कैन से लेकर सड़क फ़ोटो तक, लगभग किसी भी छवि से पाठ निष्कर्षण को सक्षम करते हैं। सर्वोत्तम पहचान गुणवत्ता प्राप्त करने के लिए एक ही छवि पर एकाधिक प्रोसेसिंग फ़िल्टर लागू किए जा सकते हैं।

संसाधन अनुकूलन

.NET के लिए Aspose.OCR प्रत्येक विशिष्ट उपयोग के मामले के लिए पहचान की गति, गुणवत्ता और संसाधन उपयोग के अत्यधिक लचीले संतुलन को सक्षम बनाता है:

संपूर्ण पहचान और तीव्र पहचान के बीच चयन करें।
पहचान के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या लाइब्रेरी को प्रोसेसर कोर की संख्या को स्वचालित रूप से स्केल करने की अनुमति दें।
गणनाओं को GPU पर लोड करके CPU को मुक्त करें।

130+ मान्यता भाषाएँ

.NET के लिए Aspose.OCR वैश्विक स्तर पर दस्तावेज़ प्रसंस्करण, डेटा निष्कर्षण और सामग्री डिजिटलीकरण के लिए एक सार्वभौमिक समाधान है। यूरोपीय, मध्य-पूर्व और एशियाई लेखन लिपियों की एक विशाल श्रृंखला के समर्थन के साथ, यह छोटे और मध्यम व्यवसायों के साथ-साथ बहुराष्ट्रीय निगमों दोनों के लिए किसी भी पैमाने के लिए अच्छी तरह से अनुकूलित है।

आप भाषा पहचान को लाइब्रेरी को सौंप सकते हैं या मैन्युअल रूप से भाषा निर्दिष्ट कर सकते हैं, जिससे पहचान प्रदर्शन और विश्वसनीयता बढ़ जाएगी। निम्नलिखित भाषाएँ समर्थित हैं:

विस्तारित लैटिन वर्णमाला: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
सिरिलिक वर्णमाला: रूसी, यूक्रेनी, कज़ाख, सर्बियाई, बेलारूसी, बल्गेरियाई;
अरबी, फ़ारसी, उर्दू;
चीनी और देवनागरी लिपि, जिसमें हिंदी, मराठी, भोजपुरी और अन्य शामिल हैं।

विशेषताएँ एवं क्षमताएँ

.NET के लिए Aspose.OCR स्वचालित रूप से फ़ोटो या स्कैन की गई छवियों से टेक्स्ट निकालता है, जिससे दस्तावेज़ों को मैन्युअल रूप से पुनः टाइप करने की आवश्यकता समाप्त हो जाती है।

फोटो ओसीआर

स्कैन-स्तरीय सटीकता के साथ स्मार्टफ़ोन फ़ोटो से टेक्स्ट निकालें।

खोजने योग्य पीडीएफ

किसी भी स्कैन को पूरी तरह से खोजने योग्य और अनुक्रमणिका योग्य दस्तावेज़ में परिवर्तित करें।

यूआरएल पहचान

किसी छवि को स्थानीय रूप से डाउनलोड किए बिना URL से पहचानें।

थोक मान्यता

बहु-पृष्ठ दस्तावेज़ों, फ़ोल्डरों और संग्रहों से सभी छवियां पढ़ें।

कोई भी फ़ॉन्ट और शैली

सभी लोकप्रिय टाइपफेस और शैलियों में टेक्स्ट को पहचानें और पहचानें।

उत्तम धुन पहचान

सर्वोत्तम पहचान परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।

बानान चेकर

गलत वर्तनी वाले शब्दों को स्वचालित रूप से ठीक करके परिणामों में सुधार करें।

छवियों में टेक्स्ट ढूंढें

छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति खोजें।

छवि पाठ की तुलना करें

केस और लेआउट की परवाह किए बिना, दो छवियों पर टेक्स्ट की तुलना करें।

प्रयोग करने में आसान

आपको छवि को टेक्स्ट में बदलने, खोजने योग्य पीडीएफ बनाने, पहचान परिणामों को दस्तावेज़ में सहेजने और बहुत कुछ करने के लिए कोड की केवल कुछ पंक्तियों की आवश्यकता है। अपने समाधानों में .NET के लिए Aspose.OCR को कैसे एकीकृत करें, यह समझने के लिए कोड नमूने देखें।

इंस्टालेशन

.NET के लिए Aspose.OCR को NuGet पैकेज या डाउनलोड करने योग्य फ़ाइल के रूप में वितरित किया जाता है। ओसीआर/नेट/) न्यूनतम निर्भरता के साथ। पैकेज को सीधे Microsoft Visual Studio से आपके प्रोजेक्ट में जोड़ा जा सकता है। बस इसे अपने प्रोजेक्ट में इंस्टॉल करें और आप छवियों से टेक्स्ट निकालने और मान्यता परिणामों को किसी भी समर्थित प्रारूप में सहेजने के लिए तैयार हैं। यदि आपके सिस्टम में CUDA सक्षम GPU है, तो आप पहचान प्रदर्शन को महत्वपूर्ण रूप से बढ़ाने के लिए GPU-त्वरित OCR इंजन का उपयोग कर सकते हैं।

आप कुछ प्रतिबंधों के साथ इंस्टॉलेशन के ठीक बाद .NET के लिए Aspose.OCR का उपयोग शुरू कर सकते हैं। एक अस्थायी लाइसेंस 30 दिनों के लिए परीक्षण संस्करण की सभी सीमाओं को हटा देता है। पूरी तरह कार्यात्मक OCR एप्लिकेशन का निर्माण शुरू करने के लिए इसका उपयोग करें और बाद में .NET के लिए Aspose.OCR खरीदने का अंतिम निर्णय लें।

किसी फ़ोटो से टेक्स्ट निकालें

जब लोग आमतौर पर ओसीआर (ऑप्टिकल कैरेक्टर रिकॉग्निशन) के बारे में सोचते हैं, तो पहला जुड़ाव अक्सर प्राथमिक कैप्चर डिवाइस के रूप में स्कैनर से होता है। इस एसोसिएशन के ऐतिहासिक कारण हैं और यह अभी भी कई संदर्भों में प्रचलित है, जो बेजोड़ गुणवत्ता के साथ भौतिक दस्तावेजों से मुद्रित पाठ को कैप्चर करने के लिए सुसंगत और नियंत्रित वातावरण प्रदान करता है। हालाँकि, स्कैनर एक विशेष उपकरण है जो हमेशा हाथ में नहीं होता है और इसे संचालित करने के लिए एक स्थिर कार्य केंद्र की आवश्यकता होती है। सौभाग्य से, आधुनिक दुनिया पारंपरिक स्कैनर का एक सुविधाजनक विकल्प प्रदान करती है - एक स्मार्टफोन कैमरा। स्मार्टफोन कैमरा प्रौद्योगिकी में प्रगति यह सुनिश्चित करती है कि एक प्रवेश स्तर का स्मार्टफोन भी ओसीआर-तैयार दस्तावेजों को कैप्चर करने के लिए पर्याप्त गुणवत्ता प्रदान करता है। और अंतर्निर्मित मेमोरी चलते-फिरते बड़ी मात्रा में दस्तावेज़ों, समाचार पत्रों, पुस्तकों, सड़क चिन्हों और अन्य पाठों को डिजिटल बनाना पहले से कहीं अधिक आसान बना देती है। उन तस्वीरों को मशीन-पठनीय टेक्स्ट में बदलने के लिए आपको बस सही तकनीक की आवश्यकता है।

.NET के लिए Aspose.OCR को विशेष रूप से सभी प्रकार की छवियों को आउट-ऑफ़-द-बॉक्स पहचानने के लिए डिज़ाइन किया गया है और निम्न-गुणवत्ता वाली तस्वीरों को भी संभालने के लिए इसे और बेहतर बनाया जा सकता है। एक आधुनिक स्मार्टफोन के साथ मिलकर, यह आपको अधिकांश रोजमर्रा की स्कैनिंग और टेक्स्ट पहचान कार्यों के लिए शक्तिशाली ओसीआर एप्लिकेशन बनाने की अनुमति देता है। सबसे उन्नत छवि प्रसंस्करण और दस्तावेज़ संरचना विश्लेषण कोड की कुछ पंक्तियों में किया जाता है, जिससे आप जटिल गणितीय एल्गोरिदम, तंत्रिका नेटवर्क और अन्य तकनीकी पेचीदगियों के बजाय व्यवसाय पर ध्यान केंद्रित कर सकते हैं।

फोटो ओसीआर - सी#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

स्कैन से खोजने योग्य पीडीएफ बनाएं

पीडीएफ कागजी दस्तावेज़ों को स्कैन करने के लिए सबसे लोकप्रिय प्रारूपों में से एक है, विशेष रूप से कई पृष्ठों को एक फ़ाइल में संयोजित करने की इसकी क्षमता के कारण। इस प्रारूप का व्यापक रूप से व्यक्तियों, व्यवसायों, बैंकों और सरकारी एजेंसियों के बीच अनुबंधों, चालानों, कानूनी दस्तावेजों, पासपोर्ट और आईडी कार्ड और कई अन्य दस्तावेजों के आदान-प्रदान के लिए उपयोग किया जाता है। हालाँकि, कोई भी स्कैन की गई पीडीएफ मूलतः छवियों का एक संग्रह है। इसमें मशीन-पठनीय पाठ नहीं है, इसलिए उपयोगकर्ता दस्तावेज़ सामग्री को खोज, कॉपी या अन्यथा हेरफेर नहीं कर सकते हैं।

.NET के लिए Aspose.OCR आपको किसी भी स्कैन किए गए पीडीएफ को पूरी तरह से खोजने योग्य और अनुक्रमित करने योग्य दस्तावेज़ में बदलने का एक तेज़, आसान और अत्यधिक विश्वसनीय तरीका प्रदान करता है। यह पृष्ठ सामग्री को सटीक रूप से पहचानता है, इसे मूल छवि पर मशीन-पठनीय टेक्स्ट परत में परिवर्तित करता है जिसे चुना जा सकता है, कॉपी किया जा सकता है, टेक्स्ट-टू-स्पीच सॉफ़्टवेयर द्वारा पढ़ा जा सकता है, और यहां तक कि अनुवादकों, सारांशकर्ताओं और अन्य एआई-संचालित एनालिटिक्स द्वारा स्वचालित रूप से संसाधित किया जा सकता है। औजार।

पीडीएफ में टेक्स्ट ओवरले जोड़ें - सी#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

छवियों में पाठ खोजें

डिजिटल अभिलेखागार, विशेष रूप से बड़े संगठनों में, अक्सर स्कैन और फ़ोटो का एक विशाल संग्रह होता है, जिनमें से कई में बहु-पृष्ठ दस्तावेज़ हो सकते हैं। आसान सूचना पुनर्प्राप्ति और नेविगेशन के लिए ऐसे अभिलेखों का प्रभावी प्रबंधन और संगठन आवश्यक है। हालाँकि, छवियों में मशीन-पठनीय पाठ नहीं होता है, जिससे दस्तावेज़ सामग्री को खोजना और उसका विश्लेषण करना असंभव हो जाता है।

.NET के लिए Aspose.OCR आपको फ़ॉन्ट, टेक्स्ट आकार, शैली और अन्य मापदंडों की परवाह किए बिना छवियों में टेक्स्ट को आसानी से खोजने की अनुमति देता है। लाइब्रेरी केस-असंवेदनशील खोजों और नियमित अभिव्यक्तियों का भी समर्थन करती है, जो विभिन्न अनुप्रयोगों और उद्योगों में बेहद उपयोगी हैं। इस कार्यक्षमता का उपयोग पाठ में पाई गई सामग्री, कीवर्ड या पैटर्न के आधार पर दस्तावेज़ों को वर्गीकृत करने के लिए किया जा सकता है; समझौतों और अनुबंधों के भीतर विशिष्ट शर्तों या खंडों की खोज करना; कीवर्ड या उनमें पाई गई सामग्री के आधार पर फ़ाइलों को पुनर्व्यवस्थित करना; दस्तावेज़ों के भीतर व्यक्तिगत डेटा का पता लगाना और उसकी पहचान करना, जिससे जीडीपीआर अनुपालन सुनिश्चित करना और संवेदनशील जानकारी को अधिक प्रभावी ढंग से प्रबंधित करना आसान हो जाता है। छवियों के साथ खोज करने से स्वचालित वर्कफ़्लो बनाने और हस्ताक्षरित अनुबंध और चालान प्राप्त करने पर विभिन्न व्यावसायिक प्रक्रियाओं को सुव्यवस्थित करने की भी अनुमति मिलती है।

छवियों में पाठ खोजें - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

.NET अनुप्रयोगों के लिए मूल OCR API

C# में छवि को टेक्स्ट में कनवर्ट करें

.NET के लिए Aspose.OCR क्यों?

वैश्विक अनुप्रयोग

सब कुछ पढ़ें

विश्वसनीय परिणाम

बैच पहचान

लेआउट का पता लगाना

लाइव कोड नमूना

छवि को टेक्स्ट में बदलें

मंच की स्वतंत्रता

समर्थित फ़ाइल स्वरूप

इमेजिस

बैच ओसीआर

मान्यता परिणाम

किसी भी सामग्री के लिए उपयुक्त

संसाधन अनुकूलन

130+ मान्यता भाषाएँ

विशेषताएँ एवं क्षमताएँ

प्रयोग करने में आसान

इंस्टालेशन

किसी फ़ोटो से टेक्स्ट निकालें

फोटो ओसीआर - सी#

स्कैन से खोजने योग्य पीडीएफ बनाएं

पीडीएफ में टेक्स्ट ओवरले जोड़ें - सी#

छवियों में पाठ खोजें

छवियों में पाठ खोजें - C#

रेडी स्टेडी गो!

समर्थन और सीखना

एपीआई का अन्वेषण करें

समर्थन प्राप्त करें

विज्ञप्ति