जावा के माध्यम से पायथन ओसीआर एपीआई के साथ छवि को टेक्स्ट में बदलें
पायथन के साथ छवियों में टेक्स्ट को पहचानें
अधिक शोकेस ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
जावा के माध्यम से पायथन के लिए Aspose.OCR क्यों?
जावा के माध्यम से पायथन के लिए Aspose.OCR आपके क्रॉस-प्लेटफ़ॉर्म पायथन नोटबुक और एप्लिकेशन में शक्तिशाली ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) क्षमताओं को सहजता से एकीकृत करता है। हमारे सहज और हाई-स्पीड एपीआई के साथ, आप आसानी से स्कैन, स्क्रीनशॉट, वेब लिंक या स्मार्टफोन फोटो से टेक्स्ट निकाल सकते हैं, जो समेकन, विश्लेषण या भंडारण के लिए तैयार परिणाम प्रदान करते हैं। स्कैन की गई छवियों, स्मार्टफोन फ़ोटो, स्क्रीनशॉट और स्कैन किए गए पीडीएफ को पहचानें, लोकप्रिय दस्तावेज़ प्रारूपों में परिणाम सहेजें। उन्नत प्री-प्रोसेसिंग फ़िल्टर घुमाई गई, तिरछी और शोर वाली छवियों को संभालते हैं। कार्यों को GPU पर लोड करके प्रदर्शन को अनुकूलित करें।
तेज़ और सटीक ओसीआर
जावा प्रौद्योगिकी के माध्यम से हमारे उन्नत पायथन के साथ उच्च गति और सटीक ओसीआर परिणाम प्राप्त करें।
बहुभाषी समर्थन
लैटिन, सिरिलिक, अरबी, फ़ारसी, इंडिक और चीनी लिपियों सहित 130+ भाषाओं में पाठ को पहचानें, जिससे जावा के माध्यम से आपके पायथन अनुप्रयोगों के लिए बहुमुखी प्रतिभा सुनिश्चित हो सके।
लचीला छवि समर्थन
जावा के माध्यम से पायथन के साथ स्कैनर, कैमरे और स्मार्टफ़ोन से छवियों को सहजता से संसाधित करें।
चीनी चरित्र पहचान में परिशुद्धता
जावा के माध्यम से अपने पायथन प्रोजेक्ट्स में 6,000 से अधिक चीनी अक्षरों को सटीकता से पहचानें।
फ़ॉन्ट शैलियाँ और फ़ॉर्मेटिंग सुरक्षित रखें
जावा के माध्यम से अपने पायथन अनुप्रयोगों में मान्यता प्राप्त पाठ के सटीक प्रतिनिधित्व के लिए फ़ॉन्ट शैलियों और स्वरूपण को बनाए रखें।
लाइव कोड नमूना
कोड की केवल तीन पंक्तियों में छवियों से पाठ पहचान आरंभ करें। सरलता का अनुभव करें!
* अपनी फ़ाइलें अपलोड करके या सेवा का उपयोग करके आप हमारी बात से सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.
छवि को टेक्स्ट में बदलें
और ज्यादा उदाहरण ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
अपनी प्राथमिकता चुनें
अपनी आवश्यकताओं के लिए सही लाइब्रेरी चुनें। सबसे कुशल समाधान चुनने के लिए उपलब्ध एपीआई और उनकी क्षमताओं का अन्वेषण करें।
बहुमुखी प्रतिभा
Python via .NET
वर्दी
Python via Java
प्रदर्शन
Python via C++
जावा बैकएंड संगतता
पायथन मॉड्यूल के रूप में डिज़ाइन की गई, हमारी लाइब्रेरी जावा को सपोर्ट करने वाले प्रमुख ऑपरेटिंग सिस्टम में अनुकूलता सुनिश्चित करती है - जिसमें माइक्रोसॉफ्ट विंडोज, लिनक्स और मैकओएस शामिल हैं। क्लाउड प्लेटफ़ॉर्म. यह आपको किसी भी कोड संशोधन की आवश्यकता को समाप्त करते हुए, एक प्लेटफ़ॉर्म पर एप्लिकेशन विकसित करने और उन्हें दूसरे पर निर्बाध रूप से चलाने में सक्षम बनाता है।
समर्थित फ़ाइल स्वरूप
Aspose.OCR for Python via Java किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) आप स्कैनर या कैमरे से प्राप्त कर सकते हैं। पहचान परिणामों को सहेजा जा सकता है, डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।
इमेजिस
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
बैच ओसीआर
- Multi-page PDF
- ZIP
- Folder
मान्यता परिणाम
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
जावा के माध्यम से पायथन के लिए सरल इंस्टालेशन
जावा के माध्यम से पायथन के लिए Aspose.OCR को न्यूनतम निर्भरता के साथ पायथन पैकेज या डाउनलोड करने योग्य फ़ाइल के रूप में वितरित किया जाता है। इसे अपने प्रोजेक्ट में आसानी से इंस्टॉल करें, और आप कई समर्थित भाषाओं में टेक्स्ट को पहचानने और विभिन्न प्रारूपों में पहचान परिणामों को सहेजने के लिए तैयार हैं।
एक परीक्षण लाइसेंस का अनुरोध करें बिना किसी सीमा के पूरी तरह कार्यात्मक ओसीआर एप्लिकेशन के विकास को शुरू करने के लिए।
पायथन अनुप्रयोगों के लिए शक्तिशाली ओसीआर
हमारी लाइब्रेरी आसानी से एकीकृत हो जाती है, जिससे पायथन एप्लिकेशन किसी भी प्लेटफॉर्म - डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड पर निर्बाध रूप से चलने में सक्षम हो जाते हैं।
130+ मान्यता भाषाएँ
हमारा पायथन और जावा ओसीआर एपीआई मिश्रित भाषाओं सहित कई भाषाओं और लोकप्रिय लेखन स्क्रिप्ट को पहचानता है:
बेहतर पहचान प्रदर्शन और विश्वसनीयता के लिए भाषा का पता लगाने को लाइब्रेरी पर छोड़ दें या स्वयं भाषा को परिभाषित करें।
- विस्तारित लैटिन वर्णमाला: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश और 80+ अधिक;
- सिरिलिक वर्णमाला: रूसी, यूक्रेनी, कज़ाख, सर्बियाई, बेलारूसी, बल्गेरियाई;
- अरबी, फ़ारसी, उर्दू;
- चीनी और देवनागरी लिपि, जिसमें हिंदी, मराठी, भोजपुरी और अन्य शामिल हैं।
उन्नत छवि प्रसंस्करण फ़िल्टर
ऑप्टिकल कैरेक्टर पहचान की सटीकता मूल छवि की गुणवत्ता पर बहुत अधिक निर्भर करती है। जावा के माध्यम से पायथन के लिए Aspose.OCR, OCR इंजन में सबमिट करने से पहले एक छवि को अनुकूलित करने के लिए स्वचालित और मैन्युअल इमेज प्रोसेसिंग फ़िल्टर दोनों की एक विस्तृत श्रृंखला प्रदान करता है:
- थोड़ी झुकी हुई छवियों को स्वचालित रूप से सीधा करें।
- गंभीर रूप से तिरछी छवियों के रोटेशन को मैन्युअल रूप से ठीक करें।
- गंदगी, धब्बे, खरोंच, चमक, अवांछित ग्रेडियेंट और अन्य प्रकार के शोर को स्वचालित रूप से हटा दें।
- छवि कंट्रास्ट को स्वचालित रूप से समायोजित करें।
- छवि को स्वचालित रूप से अपस्केल करें या मैन्युअल रूप से आकार बदलें।
- छवियों को काले और सफेद या ग्रेस्केल में बदलें।
- छवि के रंगों को उल्टा करें, जिससे प्रकाश वाले क्षेत्र गहरे और अंधेरे वाले क्षेत्र हल्के दिखाई दें।
- किसी छवि में वर्णों की मोटाई बढ़ाएँ।
- अक्षर किनारों को संरक्षित करते हुए शोर वाली छवियों को धुंधला करें।
- पृष्ठ के तिरछापन को सीधा करें और पृष्ठ फ़ोटो में कैमरा लेंस विरूपण को ठीक करें।
विभिन्न दस्तावेज़ प्रकारों के लिए विशिष्ट एपीआई
जावा के माध्यम से पायथन के लिए Aspose.OCR अधिकतम सटीकता के साथ कुछ प्रकार की छवियों से पाठ निकालने के लिए विशेष रूप से प्रशिक्षित तंत्रिका नेटवर्क प्रदान करता है:
- स्कैन किए गए या फोटोयुक्त आईडी कार्ड और पासपोर्ट।
- वाहन लाइसेंस प्लेट.
- चालान.
- रसीदें।
अंतर्निहित वर्तनी जांचकर्ता
हालाँकि जावा के माध्यम से पायथन के लिए Aspose.OCR उच्च पहचान सटीकता प्रदान करता है, मुद्रण दोष, गंदगी, या गैर-मानक फ़ॉन्ट के कारण कुछ वर्ण या शब्द गलत तरीके से पहचाने जा सकते हैं। पहचान परिणामों को और बेहतर बनाने के लिए, आप वर्तनी परीक्षक चालू कर सकते हैं, जो चयनित पहचान भाषा के आधार पर वर्तनी त्रुटियों को ढूंढता है और स्वचालित रूप से ठीक करता है।
यदि मान्यता प्राप्त पाठ में विशेष शब्दावली, संक्षिप्ताक्षर और अन्य शब्द शामिल हैं जो सामान्य वर्तनी शब्दकोशों में मौजूद नहीं हैं, तो आप अपनी स्वयं की शब्द सूची प्रदान कर सकते हैं।
कुशल बैच पहचान
हमारा पायथन ओसीआर एपीआई आपको छवि पहचान को सुव्यवस्थित करने में सक्षम बनाता है। एक ही कॉल में एकाधिक छवियों के कुशल प्रसंस्करण के लिए बहुमुखी बैच-प्रोसेसिंग विधियों का उपयोग करें:
- बहु-पृष्ठ पीडीएफ, टीआईएफएफ फाइलों को पहचानें।
- एक फ़ोल्डर के भीतर सभी फ़ाइलों को संसाधित करें।
- किसी संग्रह में सभी फ़ाइलों के लिए पहचान संभालें।
- निर्दिष्ट सूची से छवियों को पहचानें।
पायथन उदाहरणों के माध्यम से सीखना
हमारे ओसीआर समाधान के कार्यों और क्षमताओं को तेजी से समझने में आपकी सहायता के लिए डिज़ाइन किए गए विभिन्न प्रकार के पायथन उदाहरण का अन्वेषण करें। आपकी विशिष्ट व्यावसायिक आवश्यकताओं को पूरा करने वाले अनुकूलित समाधान बनाने के बारे में तुरंत जानकारी प्राप्त करें।
विशेषताएँ एवं क्षमताएँ
Aspose.OCR for Python via Java Python के लिए Aspose.OCR की उन्नत सुविधाओं का अन्वेषण करें
फोटो ओसीआर
स्कैन-स्तरीय सटीकता के साथ स्मार्टफ़ोन फ़ोटो से टेक्स्ट निकालें।
खोजने योग्य पीडीएफ
किसी भी स्कैन को पूरी तरह से खोजने योग्य और अनुक्रमणिका योग्य दस्तावेज़ में परिवर्तित करें।
यूआरएल पहचान
किसी छवि को स्थानीय रूप से डाउनलोड किए बिना URL से पहचानें।
थोक मान्यता
बहु-पृष्ठ दस्तावेज़ों, फ़ोल्डरों और संग्रहों से सभी छवियां पढ़ें।
कोई भी फ़ॉन्ट और शैली
सभी लोकप्रिय टाइपफेस और शैलियों में टेक्स्ट को पहचानें और पहचानें।
उत्तम धुन पहचान
सर्वोत्तम पहचान परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।
बानान चेकर
गलत वर्तनी वाले शब्दों को स्वचालित रूप से ठीक करके परिणामों में सुधार करें।
छवियों में टेक्स्ट ढूंढें
छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति खोजें।
छवि पाठ की तुलना करें
केस और लेआउट की परवाह किए बिना, दो छवियों पर टेक्स्ट की तुलना करें।
पायथन कोड नमूने
अपने अनुप्रयोगों में जावा के माध्यम से पायथन के लिए Aspose.OCR को सहजता से एकीकृत करने के लिए कोड नमूने खोजें।
सहज स्थापना
पायथन पैकेज या न्यूनतम निर्भरता वाली डाउनलोड करने योग्य फ़ाइल के रूप में, जावा के माध्यम से पायथन के लिए Aspose.OCR आसान वितरण सुनिश्चित करता है। इसे सीधे पायथन से अपने प्रोजेक्ट में एकीकृत करें, और आप विभिन्न प्रारूपों में पहचान परिणामों को सहेजते हुए पूर्ण ओसीआर क्षमताओं का लाभ उठाने के लिए तैयार हैं।
पोस्ट-इंस्टॉलेशन, तुरंत जावा के माध्यम से पायथन के लिए Aspose.OCR का उपयोग शुरू करें, यद्यपि कुछ सीमाओं के साथ। एक अस्थायी लाइसेंस 30 दिनों के लिए सभी परीक्षण संस्करण प्रतिबंधों को हटा देता है। इस अवधि का उपयोग पूरी तरह कार्यात्मक ओसीआर एप्लिकेशन के विकास को शुरू करने के लिए करें, जिससे आप बाद में जावा के माध्यम से पायथन के लिए Aspose.OCR खरीदने पर एक सूचित निर्णय ले सकें।
लाइसेंस लोड करें
lic = License()
lic.set_license(self.licPath)
छवि पहचान
ओसीआर अनुप्रयोगों में प्राथमिक चुनौती अंतिम उपयोगकर्ताओं के लिए स्कैनर की कमी है। हमारा एपीआई, जावा के माध्यम से पायथन के साथ सहजता से एकीकृत है, इसमें घुमाए गए, तिरछे और शोर वाले चित्रों को संभालने के लिए मजबूत अंतर्निहित छवि प्री-प्रोसेसिंग फिल्टर की सुविधा है। सभी छवि प्रारूपों के समर्थन के साथ, यह स्मार्टफोन फ़ोटो से भी विश्वसनीय पहचान की अनुमति देता है। अधिकांश प्री-प्रोसेसिंग और छवि सुधार स्वचालित हैं, केवल चुनौतीपूर्ण मामलों में आपके हस्तक्षेप की आवश्यकता होती है।
स्वचालित छवि सुधार लागू करें - पायथन
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
पायथन यूनिवर्सल कन्वर्टर
हमारा एपीआई स्कैनर, कैमरा या स्मार्टफोन से किसी भी छवि को कुशलता से पढ़ता है: पीडीएफ दस्तावेज़, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी फाइलें। बहु-पृष्ठ पीडीएफ दस्तावेजों, टीआईएफएफ और डीजेवीयू छवियों के लिए पूर्ण समर्थन बहुमुखी प्रतिभा सुनिश्चित करता है। आप URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।
पहचान परिणाम लोकप्रिय दस्तावेज़ और डेटा विनिमय प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, JSON और XML।
पीडीएफ को पहचानें और परिणामों को विभिन्न आउटपुट स्वरूपों में सहेजें - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
संसाधन उपयोग का अनुकूलन
OCR विरल पाठ और शोर/रंगीन पृष्ठभूमि वाली छवियों से सामग्री निकालने के लिए एक विशेष पहचान एल्गोरिथ्म प्रदान करता है। यह विधि निम्नलिखित व्यावसायिक मामलों में OCR सटीकता में उल्लेखनीय सुधार करती है:
- सड़क की तस्वीरों से पाठ पढ़ें.
- सड़क छवियों के भीतर सड़क संकेतों और साइनबोर्डों को विभाजित करें और पहचानें।
- मूल्य टैग का पता लगाएं और निकाले गए पाठ को कीमतों के रूप में समझें।
- खाद्य लेबलों पर रुचि के क्षेत्रों को खोजें और एकत्रित करें, जैसे कि पोषण संबंधी जानकारी या घटक सूची।
- कार लाइसेंस प्लेटों को पहचानें और उनका विश्लेषण करें।
- मेनू और कैटलॉग से टेक्स्ट निकालें.
खुला क्षेत्र ओसीआर - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
सड़क की तस्वीरों से टेक्स्ट निकाला जा रहा है
पायथन के लिए ओसीआर एक विशेष पहचान एल्गोरिथ्म प्रदान करता है जो अंधेरे और धुंधली तस्वीरों सहित वाहन लाइसेंस प्लेटों से पाठ निकालता है। परिणामी पाठ को स्वचालित रूप से डेटाबेस में सहेजा जा सकता है या स्वचालित रूप से सत्यापित किया जा सकता है।
कार का नंबर पहचानें - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)