जावा के माध्यम से पायथन ओसीआर एपीआई के साथ पाठ में छवि को परिवर्तित करें
पायथन के साथ छवियों में पाठ को पहचानें
अधिक शोकेस ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
क्यों java के माध्यम से पायथन के लिए aspose.ocr?
जावा के माध्यम से पायथन के लिए aspose.ocr मूल रूप से अपने क्रॉस-प्लेटफॉर्म पायथन नोटबुक और अनुप्रयोगों में शक्तिशाली ऑप्टिकल चरित्र मान्यता (OCR) क्षमताओं को एकीकृत करता है। हमारे सहज और उच्च गति वाले एपीआई के साथ, आप आसानी से स्कैन, स्क्रीनशॉट, वेब लिंक, या स्मार्टफोन फ़ोटो से पाठ निकाल सकते हैं, परिणाम वितरित कर सकते हैं जो समेकन, विश्लेषण या भंडारण के लिए तैयार हैं। स्कैन की गई छवियों, स्मार्टफोन फ़ोटो, स्क्रीनशॉट, और स्कैन किए गए PDFs को पहचानें, लोकप्रिय दस्तावेज़ प्रारूपों में परिणाम की बचत करें। उन्नत प्री-प्रोसेसिंग फिल्टर घुमाए गए, तिरछे और शोर छवियों को संभालते हैं। GPU को कार्यों को उतारकर प्रदर्शन का अनुकूलन करें।

स्विफ्ट और सटीक OCR
जावा तकनीक के माध्यम से हमारे उन्नत पायथन के साथ उच्च गति और सटीक OCR परिणाम प्राप्त करें।
बहुभाषी समर्थन
140+ भाषाओं में पाठ को पहचानें, जिसमें लैटिन, सिरिलिक, अरबी, फारसी, इंडिक, और चीनी स्क्रिप्ट शामिल हैं, जो जावा के माध्यम से अपने पायथन अनुप्रयोगों के लिए बहुमुखी प्रतिभा सुनिश्चित करते हैं।
लचीली छवि समर्थन
जावा के माध्यम से पायथन के साथ स्कैनर, कैमरा और स्मार्टफोन से छवियों को प्रक्रिया करें।
चीनी चरित्र मान्यता में परिशुद्धता
जावा के माध्यम से अपने पायथन परियोजनाओं में सटीक के साथ 6,000 से अधिक चीनी पात्रों को पहचानें।
फ़ॉन्ट शैलियों और स्वरूपण को संरक्षित करें
जावा के माध्यम से अपने पायथन अनुप्रयोगों में मान्यता प्राप्त पाठ के सटीक प्रतिनिधित्व के लिए फ़ॉन्ट शैलियों और स्वरूपण को बनाए रखें।
लाइव कोड नमूना
कोड की केवल तीन पंक्तियों में छवियों से पाठ मान्यता शुरू करें। सादगी का अनुभव करें!
* अपनी फ़ाइलों को अपलोड करके या उस सेवा का उपयोग करके आप हमारे साथ सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.
छवि को पाठ में परिवर्तित करें
और ज्यादा उदाहरण ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
अपनी प्राथमिकता चुनें
अपनी आवश्यकताओं के लिए सही पुस्तकालय चुनें। सबसे कुशल समाधान का चयन करने के लिए उपलब्ध एपीआई और उनकी क्षमताओं का अन्वेषण करें।
बहुमुखी प्रतिभा
Python via .NET
वर्दी
Python via Java
प्रदर्शन
Python via C++
जावा बैकेंड संगतता
एक पायथन मॉड्यूल के रूप में डिज़ाइन किया गया, हमारी लाइब्रेरी java का समर्थन करने वाले प्रमुख ऑपरेटिंग सिस्टम में संगतता सुनिश्चित करती है - जिसमें Microsoft Windows, Linux, और MacOS, या क्लाउड प्लेटफॉर्म शामिल हैं। यह आपको एक प्लेटफ़ॉर्म पर एप्लिकेशन विकसित करने में सक्षम बनाता है और किसी भी कोड संशोधनों की आवश्यकता को समाप्त करते हुए, उन्हें दूसरे पर चलाता है।
समर्थित फ़ाइल स्वरूप
Aspose.OCR for Python via Java किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) आप एक स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणामों को सहेजा जा सकता है, एक डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।
इमेजिस
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
बैच ओसीआर
- Multi-page PDF
- ZIP
- Folder
मान्यता परिणाम
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
जावा के माध्यम से पायथन के लिए सहज स्थापना
जावा के माध्यम से पायथन के लिए aspose.ocr को एक पायथन पैकेज के रूप में या न्यूनतम निर्भरता के साथ एक डाउनलोड करने योग्य फ़ाइल के रूप में दिया जाता है। आसानी से इंस्टॉल यह आपके प्रोजेक्ट में है, और आप कई समर्थित भाषाओं में ग्रंथों को पहचानने और विभिन्न स्वरूपों में मान्यता परिणामों को बचाने के लिए तैयार हैं।
एक परीक्षण लाइसेंस का अनुरोध करें बिना किसी सीमा के एक पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को किकस्टार्ट करने के लिए।
पायथन अनुप्रयोगों के लिए शक्तिशाली OCR
हमारी लाइब्रेरी आसानी से एकीकृत हो जाती है, किसी भी प्लेटफ़ॉर्म - डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड पर किसी भी प्लेटफॉर्म पर मूल रूप से चलाने के लिए पायथन एप्लिकेशन को सक्षम करती है।
140+ मान्यता भाषाएँ
हमारे पायथन और जावा ओसीआर एपीआई ने मिश्रित भाषाओं सहित भाषाओं और लोकप्रिय लेखन स्क्रिप्ट के ढेरों को पहचानता है:
लाइब्रेरी में भाषा का पता लगाना छोड़ दें या बढ़ी हुई मान्यता प्रदर्शन और विश्वसनीयता के लिए भाषा को स्वयं परिभाषित करें।
- ** विस्तारित लैटिन ** वर्णमाला: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
- ** सिरिलिक ** वर्णमाला: रूसी, यूक्रेनी, कजाख, सर्बियाई, बेलारूसन, बल्गेरियाई;
- अरबी, फारसी, उर्दू;
- हिंदी, मराठी, भोजपुरी और अन्य सहित चीनी और देवनागरी स्क्रिप्ट।
बढ़ाया छवि प्रसंस्करण फ़िल्टर
ऑप्टिकल चरित्र मान्यता की सटीकता मूल छवि की गुणवत्ता पर बहुत अधिक निर्भर करती है। जावा के माध्यम से पायथन के लिए aspose.ocr, OCR इंजन को जमा करने से पहले एक छवि को अनुकूलित करने के लिए स्वचालित और मैनुअल इमेज प्रोसेसिंग दोनों दोनों की एक विस्तृत सरणी प्रदान करता है:
- स्वचालित रूप से थोड़ी झुकी हुई छवियों को सीधा करें।
- मैन्युअल रूप से गंभीर रूप से तिरछा छवियों के रोटेशन को सही करें।
- स्वचालित रूप से गंदगी, धब्बे, खरोंच, चकाचौंध, अवांछित ग्रेडिएंट और अन्य प्रकार के शोर को हटा दें।
- स्वचालित रूप से छवि कंट्रास्ट को समायोजित करें।
- स्वचालित रूप से अपस्केल या मैन्युअल रूप से छवि का आकार बदलें।
- छवियों को काले और सफेद या ग्रेस्केल में परिवर्तित करें।
- छवि रंगों को उल्टा कर देता है, प्रकाश क्षेत्र को अंधेरे और अंधेरे क्षेत्र प्रकाश दिखाई देते हैं।
- एक छवि में वर्णों की मोटाई बढ़ाएं।
- अक्षर किनारों को संरक्षित करते समय ब्लर शोर छवियां।
- पेज की तस्वीरों में सीधे पेज तिरछी और सही कैमरा लेंस विरूपण।
विभिन्न दस्तावेज़ प्रकारों के लिए एपीआई को निर्दिष्ट किया
जावा के माध्यम से पायथन के लिए aspose.ocr अधिकतम सटीकता के साथ कुछ प्रकार की छवियों से पाठ निकालने के लिए विशेष रूप से प्रशिक्षित तंत्रिका नेटवर्क प्रदान करता है:
- स्कैन या फोटो खींचे गए आईडी कार्ड और पासपोर्ट।
- वाहन लाइसेंस प्लेट।
- चालान।
- रसीदें।
अंतर्निहित मंत्र चेकर
यद्यपि जावा के माध्यम से पायथन के लिए aspose.ocr उच्च मान्यता सटीकता प्रदान करता है, मुद्रण दोष, गंदगी, या गैर-मानक फोंट कुछ पात्रों या शब्दों को गलत तरीके से मान्यता प्राप्त कर सकते हैं। मान्यता परिणामों को और बेहतर बनाने के लिए, आप स्पेल चेकर को चालू कर सकते हैं, जो चयनित मान्यता भाषा के आधार पर वर्तनी त्रुटियों को पाता है और स्वचालित रूप से सही करता है।
यदि मान्यता प्राप्त पाठ में विशेष शब्दावली, संक्षिप्तीकरण और अन्य शब्द शामिल हैं जो सामान्य वर्तनी शब्दकोशों में मौजूद नहीं हैं, तो आप अपनी खुद की शब्द सूची प्रदान कर सकते हैं।
कुशल बैच मान्यता
हमारा पायथन ओसीआर एपीआई आपको छवि मान्यता को सुव्यवस्थित करने का अधिकार देता है। एक ही कॉल में कई छवियों के कुशल प्रसंस्करण के लिए बहुमुखी बैच-प्रोसेसिंग विधियों का उपयोग करें:
- मल्टी-पेज पीडीएफ, टीआईएफएफ फ़ाइलों को पहचानें।
- एक फ़ोल्डर के भीतर सभी फ़ाइलों को संसाधित करें।
- एक संग्रह में सभी फ़ाइलों के लिए मान्यता को संभालें।
- एक निर्दिष्ट सूची से छवियों को पहचानें।
अजगर के उदाहरणों के माध्यम से सीखना
विभिन्न प्रकार के पायथन उदाहरणों का अन्वेषण करें, जो आपके OCR समाधान के कार्यों और क्षमताओं को तेजी से समझने में मदद करने के लिए डिज़ाइन किया गया है। आपकी विशिष्ट व्यावसायिक आवश्यकताओं को पूरा करने वाले अनुकूलित समाधान बनाने में जल्दी से अंतर्दृष्टि प्राप्त करें।
सुविधाएँ और क्षमता
Aspose.OCR for Python via Java अजगर के लिए aspose.ocr की उन्नत सुविधाओं का अन्वेषण करें
फोटो ओसीआर
स्कैन-स्तरीय सटीकता के साथ स्मार्टफोन तस्वीरों से पाठ निकालें।
खोज योग्य पीडीएफ
किसी भी स्कैन को पूरी तरह से खोजा और सूचकांक योग्य दस्तावेज़ में बदलें।
URL मान्यता
स्थानीय रूप से डाउनलोड किए बिना URL से एक छवि को पहचानें।
थोक मान्यता
बहु-पृष्ठ दस्तावेज़, फ़ोल्डर और अभिलेखागार से सभी चित्र पढ़ें।
कोई भी फ़ॉन्ट और शैली
सभी लोकप्रिय टाइपफेस और शैलियों में पाठ को पहचानें और पहचानें।
ठीक धुन मान्यता
सर्वोत्तम मान्यता परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।
बानान चेकर
गलत शब्दों को स्वचालित रूप से सही करके परिणामों में सुधार करें।
छवियों में पाठ खोजें
छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति के लिए खोजें।
छवि ग्रंथों की तुलना करें
मामले और लेआउट की परवाह किए बिना, दो छवियों पर ग्रंथों की तुलना करें।
पायथन कोड नमूने
अपने अनुप्रयोगों में जावा के माध्यम से पायथन के लिए मूल रूप से aspose.ocr को एकीकृत करने के लिए कोड नमूनों की खोज करें।
सहज स्थापना
एक पायथन पैकेज या न्यूनतम निर्भरता के साथ एक डाउनलोड करने योग्य फ़ाइल के रूप में, जावा के माध्यम से पायथन के लिए aspose.ocr आसान वितरण सुनिश्चित करता है। इसे अपनी परियोजना में सीधे पायथन से एकीकृत करें, और आप पूरी तरह से ओसीआर क्षमताओं का लाभ उठाने के लिए तैयार हैं, विभिन्न स्वरूपों में मान्यता परिणामों को बचाने के लिए। एक अस्थायी लाइसेंस 30 दिनों के लिए सभी परीक्षण संस्करण प्रतिबंधों को हटा देता है। पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को शुरू करने के लिए इस अवधि का उपयोग करें, जिससे आप बाद में जावा के माध्यम से पायथन के लिए खरीदने के लिए एक सूचित निर्णय लेने की अनुमति दे।
भार लाइसेंस
lic = License()
lic.set_license(self.licPath)
छवि मान्यता
OCR अनुप्रयोगों में प्राथमिक चुनौती अंतिम उपयोगकर्ताओं के लिए स्कैनर की कमी है। हमारी एपीआई, जावा के माध्यम से पायथन के साथ मूल रूप से एकीकृत है, इसमें मजबूत अंतर्निहित छवि पूर्व-प्रसंस्करण फिल्टर हैं जो घुमाए गए, तिरछी और शोर छवियों को संभालते हैं। सभी छवि प्रारूपों के लिए समर्थन के साथ संयुक्त, यह स्मार्टफोन तस्वीरों से भी विश्वसनीय मान्यता की अनुमति देता है। अधिकांश पूर्व-प्रसंस्करण और छवि सुधार स्वचालित हैं, केवल चुनौतीपूर्ण मामलों में आपके हस्तक्षेप की आवश्यकता होती है।
स्वचालित छवि सुधार लागू करें - पायथन
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
पायथन यूनिवर्सल कनवर्टर
हमारी एपीआई ने स्कैनर, कैमरा, या स्मार्टफोन: पीडीएफ डॉक्यूमेंट्स, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी फाइलों से किसी भी छवि को पढ़ा है। मल्टी-पेज पीडीएफ दस्तावेजों, टीआईएफएफ और डीजेवीयू छवियों के लिए पूर्ण समर्थन बहुमुखी प्रतिभा सुनिश्चित करता है। आप एक URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।
मान्यता परिणाम लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, JSON और XML।
पीडीएफ को पहचानें और विभिन्न आउटपुट प्रारूपों के लिए परिणाम सहेजें - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
संसाधन उपयोग का अनुकूलन
OCR विरल पाठ और शोर/रंगीन पृष्ठभूमि के साथ छवियों से सामग्री निकालने के लिए एक विशेष मान्यता एल्गोरिथ्म प्रदान करता है। यह विधि निम्नलिखित व्यावसायिक मामलों में OCR सटीकता में काफी सुधार करती है:
- सड़क की तस्वीरों से पाठ पढ़ें।
- सड़क छवियों के भीतर सड़क संकेतों और साइनबोर्ड की पहचान करें।
- मूल्य टैग का पता लगाएं और निकाले गए पाठ को कीमतों के रूप में व्याख्या करें।
- खाद्य लेबल पर रुचि के क्षेत्रों को खोजें और एकत्रित करें, जैसे कि पोषण संबंधी जानकारी या घटक सूचियाँ।
- कार लाइसेंस प्लेटों को पहचानें और उनका विश्लेषण करें।
- मेनू और कैटलॉग से पाठ निकालें।
ओपन एरिया ओसीआर - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
सड़क की तस्वीरों से पाठ निकालना
पायथन के लिए OCR एक विशेष मान्यता एल्गोरिथ्म प्रदान करता है जो वाहन लाइसेंस प्लेटों से पाठ निकालता है, जिसमें अंधेरे और धुंधली तस्वीरें शामिल हैं। परिणामी पाठ तब स्वचालित रूप से डेटाबेस में सहेजा जा सकता है या स्वचालित रूप से सत्यापित किया जा सकता है।
कार नंबर को पहचानें - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)