Aspose.OCR  for C++

छवियों और PDF को C++ में टेक्स्ट में बदलें

कोड की कुछ पंक्तियों के साथ अपने C++ अनुप्रयोगों में ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) जोड़ें।

  Download Free Trial
  
 

Aspose.OCR C++ के लिए कोड की 5 पंक्तियों में ऑप्टिकल कैरेक्टर रिकग्निशन क्षमताओं के साथ आपके अनुप्रयोगों का विस्तार करता है। तंत्रिका नेटवर्क और मशीन सीखने में हमारे अनुभव को बेहतर प्रदर्शन और सटीकता के साथ एक ओसीआर पुस्तकालय में अनुवादित किया गया है जो लैटिन और सिरिलिक शेयरों के साथ-साथ चीनी पर आधारित 26 भाषाओं का समर्थन करता है। ओसीआर एपीआई स्कैन की गई छवियों, स्मार्टफोन फोटो, स्क्रीनशॉट, छवियों के क्षेत्रों और स्कैन किए गए पीडीएफ को पहचान सकता है और सबसे लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में परिणाम लौटा सकता है। यह पूरी तरह से ऑफ़लाइन है और काम करने के लिए इंटरनेट कनेक्शन की आवश्यकता नहीं है। एपीआई को आरंभ करने के लिए न्यूनतम प्रयास और मास्टर करने के लिए एक उथले सीखने की अवस्था की आवश्यकता होती है। सभी प्री-प्रोसेसिंग, स्क्यू करेक्शन, नॉइज़ रिमूवल, लैंग्वेज डिटेक्शन, मल्टी-थ्रेडिंग और अन्य जटिल कार्य स्वचालित रूप से किए जाते हैं, लेकिन कठिन मामलों से निपटने के लिए इसे ट्यून किया जा सकता है।

उन्नत सी++ ओसीआर एपीआई विशेषताएं

छवियों से टेक्स्ट निकालता है और खोजने योग्य PDF बनाता है

किसी भी छवि का समर्थन करता है जिसे आप स्कैनर या कैमरा के रूप में प्राप्त कर सकते हैं

विस्तारित लैटिन और सिरिलिक लिपियों को पढ़ता है

6,000 से अधिक चीनी अक्षरों को पहचानता है

सभी लोकप्रिय टाइपफेस और स्वरूपण का पता लगाता है और पहचानता है

मान्यता से पहले छवियों को पूर्व-संसाधित करें

पूरी छवि या केवल चयनित क्षेत्रों को संसाधित करता है

घुमावदार, तिरछी और शोर छवियों का समर्थन करता है

किसी फ़ोल्डर या संग्रह में सभी छवियों की बैच पहचान

वेब लिंक के रूप में प्रदान की गई छवियों को पहचानता है

गलत वर्तनी वाले शब्दों को ढूंढता है और स्वचालित रूप से सुधारता है

JSON के रूप में मान्यता परिणाम प्राप्त करें

प्रयोग करने में आसान

क्या आपको अभी भी लगता है कि C++ OCR कठिन है? हमारे पुस्तकालय के साथ, आपको छवि को पहचानने और परिणाम प्रदर्शित करने के लिए कोड की केवल 5 पंक्तियों की आवश्यकता है। इस कोड को आज़माएं और अपने लिए देखें:

5 पंक्तियों में पाठ के लिए छवि - C++

// छवि पथ प्रदान करें
std::string image_path = "../Data/Source/sample.png";

// परिणाम के लिए बफर तैयार करें
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// जादू करो
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// मान्यता परिणाम प्रदर्शित करें
std::wcout << buffer << L"\n";

26 मान्यता भाषाएँ

OCR API मिश्रित भाषाओं वाले टेक्स्ट सहित बड़ी संख्या में भाषाओं और सभी लोकप्रिय लेखन लिपियों को पहचान सकता है।

  • विस्तारित लैटिन वर्णमाला : क्रोएशियाई, चेक, डेनिश, डच, अंग्रेजी, एस्टोनियाई, फिनिश, फ्रेंच, जर्मन, इतालवी, लातवियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, पुर्तगाली, रोमानियाई, स्लोवाक, स्लोवेनियाई, स्पेनिश, स्वीडिश।
  • सिरिलिक वर्णमाला : बेलारूसी, बल्गेरियाई, कज़ाख, रूसी, सर्बियाई, यूक्रेनी।
  • चीनी : 6,000 से अधिक वर्ण।

आप भाषा की पहचान को पुस्तकालय पर छोड़ सकते हैं या पहचान के प्रदर्शन और विश्वसनीयता को बढ़ाने के लिए भाषा को स्वयं परिभाषित कर सकते हैं।

बैच प्रसंस्करण

OCR API आपको विभिन्न बैच-प्रोसेसिंग विधियों की पेशकश करके प्रत्येक छवि को एक-एक करके पहचानने से मुक्त करता है जो आपको एक कॉल में कई छवियों को पहचानने की अनुमति देता है:

  • बहु-पृष्ठ पीडीएफ और टीआईएफएफ फाइलों की पहचान।
  • एक फ़ोल्डर में सभी फाइलों की पहचान।
  • एक संग्रह में सभी फाइलों की पहचान।

ज़िप संग्रह को पहचानें - C++

// संग्रह पथ प्रदान करें
std::string archive_path = "book.zip";

// परिणाम के लिए बफर तैयार करें
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// डिफ़ॉल्ट मानों के साथ रिकग्निशनसेटिंग ऑब्जेक्ट प्रारंभ करें
RecognitionSettings settings;

// पहचानना
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

स्वरूपण संरक्षित करें

ओसीआर पुस्तकालय सभी लोकप्रिय टाइपफेस जैसे एरियल, टाइम्स न्यू रोमन, कूरियर न्यू, ताहोमा, कैलीब्री और अधिक को नियमित, बोल्ड और इटैलिक शैलियों में पढ़ता है और ओसीआर परिणामों में स्वरूपण को सावधानीपूर्वक संरक्षित करता है। आप पहचान परिणामों को पंक्तियों में विभाजित कर सकते हैं और किसी पृष्ठ में टेक्स्ट क्षेत्रों का पता लगा सकते हैं।

तस्वीरों को पहचानें

ओसीआर अनुप्रयोगों को व्यापक रूप से अपनाना आमतौर पर इस तथ्य से रोक दिया जाता है कि अधिकांश उपयोगकर्ताओं के लिए स्कैनर सामान्य नहीं हैं। हमारी OCR लाइब्रेरी में शक्तिशाली बिल्ट-इन इमेज प्री-प्रोसेसिंग फिल्टर हैं जो डार्क, रोटेट, स्क्यूड और नॉइज़ इमेज को हैंडल कर सकते हैं। सभी छवि प्रारूपों के समर्थन के संयोजन में, यह स्मार्टफोन की तस्वीरों की भी विश्वसनीय पहचान की अनुमति देता है। अधिकांश पूर्व-प्रसंस्करण और छवि सुधार स्वचालित रूप से किया जाता है, इसलिए आपको केवल कठिन मामलों में ही हस्तक्षेप करना होगा।

तिरछा सुधार के लिए कस्टम कोण सेट करें - C++

// मूल छवि
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// परिणाम के लिए बफर तैयार करें
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// तिरछा कोण समायोजित करें
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// छवि को पहचानें
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

वर्तनी की जाँच

जबकि ओसीआर विश्वसनीय परिणाम देता है, धूल और प्रिंट दोषों के कारण कुछ प्रतीकों को गलत तरीके से पहचाना जा सकता है। ओसीआर एपीआई में एक अंतर्निहित वर्तनी परीक्षक है जो स्वचालित रूप से गलत वर्तनी वाले शब्दों को बदल देता है और आपको पहचान परिणामों को मैन्युअल रूप से सही करने से मुक्त करता है।

  
  

Aspose अन्य लोकप्रिय प्रोग्रामिंग भाषाओं के लिए मूल OCR API भी प्रदान करता है: