पायथन ओसीआर लाइब्रेरी
पायथन ओसीआर के साथ छवियों को पाठ में परिवर्तित करें
अधिक शोकेस ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
.Net के माध्यम से पायथन के लिए क्यों aspose.ocr?
.NET के माध्यम से पायथन के लिए Aspose OCR के साथ एक यात्रा पर-एक बहुमुखी और उपयोगकर्ता के अनुकूल OCR API। अपने पायथन अनुप्रयोगों में OCR कार्यक्षमता को 5 से कम कोड के साथ एम्बेड करें, जटिल गणित या तंत्रिका नेटवर्क की आवश्यकता को समाप्त कर दें। हमारा शक्तिशाली ओसीआर इंजन अंग्रेजी, सिरिलिक, अरबी, फारसी, हिंदी, चीनी, जापानी, कोरियाई, तमिल और कई और अधिक सहित 140+ भाषाओं का समर्थन करते हुए, अद्वितीय गति और सटीकता प्रदान करता है। चाहे वह स्कैन की गई छवियों, स्मार्टफोन फ़ोटो, स्क्रीनशॉट, या स्कैन की गई पीडीएफ, लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में परिणाम प्राप्त करें। घुमाए गए, तिरछे और शोर छवियों को संभालने के लिए लीवरेज प्री-प्रोसेसिंग फिल्टर।

कुशल और सटीक ओसीआर
उन्नत पायथन तकनीक के साथ ओसीआर परिणामों में अद्वितीय गति और सटीकता का अनुभव करें।
बहुभाषी
140+ भाषाओं में पाठ को पहचानें: अंग्रेजी, फ्रेंच, जर्मन, स्पेनिश, रूसी, चीनी, हिंदी, जापानी, कोरियाई, तमिल, अरबी, फारसी, और बहुत कुछ।
सार्वभौमिक
पायथन का उपयोग करके विविध स्रोतों - स्कैनर, कैमरा और स्मार्टफोन से आसानी से छवियों को संसाधित करें।
एशियाई भाषाएँ
चीनी, अरबी, देवनागरी और द्रविड़ियन लिपियों के साथ-साथ मिश्रित भाषा के ग्रंथों की सटीक मान्यता प्राप्त करें।
लेआउट को संरक्षित करना
सटीक पाठ प्रतिनिधित्व के लिए स्रोत स्वरूपण बनाए रखें, और तालिकाओं को पहचानें।
लाइव कोड नमूना
पायथन कोड की सिर्फ तीन पंक्तियों में एक छवि को पाठ में परिवर्तित करें। अपने लिए कोशिश करो!
* अपनी फ़ाइलों को अपलोड करके या उस सेवा का उपयोग करके आप हमारे साथ सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.
छवि को पाठ में परिवर्तित करें
अधिक उदाहरणों की खोज करें ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
अपनी प्राथमिकता चुनें
अपनी आवश्यकताओं के लिए सही पुस्तकालय चुनें। सबसे कुशल समाधान का चयन करने के लिए उपलब्ध एपीआई और उनकी क्षमताओं का अन्वेषण करें।
बहुमुखी प्रतिभा
Python via .NET
वर्दी
Python via Java
प्रदर्शन
Python via C++
हर जगह चलता है
नाम के बावजूद, .NET के माध्यम से पायथन के लिए aspose.ocr को लक्ष्य प्लेटफ़ॉर्म पर .NET को स्थापित करने की आवश्यकता नहीं है। स्थापना पैकेज पहले से ही सभी आवश्यक घटकों के साथ आता है और किसी भी प्लेटफ़ॉर्म पर मूल रूप से काम कर सकता है - चाहे वह एक स्थानीय मशीन, वेब सर्वर या क्लाउड हो।
समर्थित फ़ाइल स्वरूप
Aspose.OCR for Python via .NET किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) आप एक स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणामों को सहेजा जा सकता है, एक डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।
इमेजिस
- JPEG
- PNG
- TIFF
- BMP
- GIF
बैच ओसीआर
- Multi-page PDF
- DjVu
- ZIP
- Folder
मान्यता परिणाम
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
इंस्टालेशन
.NET के माध्यम से पायथन के लिए aspose.ocr को न्यूनतम निर्भरता के साथ या डाउनलोड करने योग्य फ़ाइल या pypi पैकेज के रूप में एक पायथन पैकेज के रूप में दिया जाता है। आसानी से इंस्टॉल यह आपके प्रोजेक्ट में है, और आप 140+ भाषाओं में ग्रंथों को पहचानने और विभिन्न प्रारूपों में मान्यता परिणामों को बचाने के लिए तैयार हैं।
एक परीक्षण लाइसेंस का अनुरोध करें बिना किसी सीमा के एक पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को किकस्टार्ट करने के लिए।
पायथन के तहत ocr
हमारी लाइब्रेरी आसानी से एकीकृत हो जाती है, किसी भी प्लेटफ़ॉर्म - डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड पर किसी भी प्लेटफॉर्म पर मूल रूप से चलाने के लिए पायथन एप्लिकेशन को सक्षम करती है।
140+ मान्यता भाषाएँ
हमारी जावा OCR लाइब्रेरी वैश्विक स्तर पर दस्तावेज़ प्रसंस्करण, डेटा निष्कर्षण और सामग्री डिजिटलीकरण के लिए एक सार्वभौमिक समाधान है। यूरोपीय, मध्य-पूर्व और एशियाई लेखन स्क्रिप्ट के एक विशाल सरणी के लिए समर्थन के साथ, यह किसी भी देश और व्यवसाय के लिए अच्छी तरह से अनुकूलित है।
जावा के लिए Aspose OCR बहुभाषी दस्तावेजों में पाठ को पहचानता है, जैसे कि चीनी/अंग्रेजी, अरबी/फ्रेंच, या सिरिलिक/अंग्रेजी। निम्नलिखित भाषाओं का समर्थन किया जाता है:
- ** विस्तारित लैटिन **: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
- ** सिरिलिक ** वर्णमाला: रूसी, यूक्रेनी, कजाख, बल्गेरियाई, मिश्रित सिरिलिक/अंग्रेजी ग्रंथों सहित;
- अरबी, फारसी, उर्दू, अंग्रेजी के साथ मिश्रित ग्रंथों सहित;
- चीनी, कोरियाई, जापानी, देवनागरी और द्रविड़ियन भाषाएं, जिनमें हिंदी, तमिल, मराठी और अन्य शामिल हैं। मिश्रित भाषा के ग्रंथ भी समर्थित हैं।
शक्तिशाली प्रसंस्करण फ़िल्टर
ऑप्टिकल चरित्र मान्यता की सटीकता और विश्वसनीयता मूल छवि की गुणवत्ता पर अत्यधिक निर्भर है। .NET के माध्यम से पायथन के लिए Aspose OCR पूरी तरह से स्वचालित और मैनुअल इमेज प्रोसेसिंग फिल्टर की एक बड़ी संख्या प्रदान करता है जो OCR इंजन को भेजे जाने से पहले एक छवि को बढ़ाता है:
- स्वचालित रूप से उल्टा और घुमाई गई छवियों को घुमाएं।
- उल्टे छवियों का पता लगाएं और सफेद-ऑन-ब्लैक टेक्स्ट निकालें।
- स्वचालित रूप से गंदगी, धब्बे, खरोंच, चकाचौंध, अवांछित ग्रेडिएंट और अन्य शोर को हटा दें।
- स्वचालित रूप से छवि कंट्रास्ट को समायोजित करें।
- स्वचालित रूप से अपस्केल, या मैन्युअल रूप से छवि का आकार बदलें।
- छवियों को काले और सफेद या ग्रेस्केल में परिवर्तित करें।
- छवि के संभावित समस्याग्रस्त क्षेत्रों का पता लगाएं और दोष के प्रकार और इसके निर्देशांक पर जानकारी वापस करें।
- एक छवि में वर्णों की मोटाई बढ़ाएं।
- अक्षरों के किनारों को संरक्षित करते समय ब्लर शोर छवियां।
- पेज की वक्रता को सीधा करें और पेज फ़ोटो के लिए कैमरा लेंस विरूपण को ठीक करें।
विशिष्ट दस्तावेज़ प्रकारों के लिए अनुकूलित
.NET के माध्यम से पायथन के लिए Aspose OCR अधिकतम सटीकता के साथ कुछ प्रकार की छवियों से पाठ निकालने के लिए विशेष रूप से प्रशिक्षित तंत्रिका नेटवर्क प्रदान करता है:
अंतर्निहित मंत्र चेकर
यद्यपि हमारी पायथन ओसीआर लाइब्रेरी उच्च मान्यता सटीकता प्रदान करती है, मुद्रण दोष, गंदगी, या गैर-मानक फोंट कुछ पात्रों या शब्दों को गलत तरीके से मान्यता प्राप्त कर सकते हैं। मान्यता परिणामों को और बेहतर बनाने के लिए, आप स्पेल चेकर को चालू कर सकते हैं, जो चयनित मान्यता भाषा के आधार पर वर्तनी त्रुटियों को पाता है और स्वचालित रूप से सही करता है।
यदि मान्यता प्राप्त पाठ में विशेष शब्दावली, संक्षिप्तीकरण और अन्य शब्द शामिल हैं जो सामान्य वर्तनी शब्दकोशों में मौजूद नहीं हैं, तो आप अपनी खुद की शब्द सूची प्रदान कर सकते हैं।
बैच मान्यता
हमारे पायथन ओसीआर एपीआई आपको एक -एक करके छवियों को पहचानने से मुक्त करता है। एक कॉल में कई छवियों को पहचानने के लिए विभिन्न बैच-प्रोसेसिंग विधियों को नियोजित करें:
- मल्टी-पेज पीडीएफ, टीआईएफएफ और डीजेवीयू फाइलों की मान्यता।
- एक फ़ोल्डर में सभी फ़ाइलों की मान्यता।
- एक संग्रह में सभी फ़ाइलों की मान्यता।
- एक सूची से सभी फ़ाइलों की मान्यता।
नमूना द्वारा सीखना
पायथन के लिए OCR उदाहरण की एक सरणी प्रदान करता है, जो पायथन में लिखा गया है, जिससे आप जल्दी से अपने कार्यों और क्षमताओं से खुद को परिचित कर सकते हैं। अपने पायथन व्यवसाय की जरूरतों को पूरा करने के लिए सिलवाया समाधान बनाने के लिए अंतर्दृष्टि प्राप्त करें।
सुविधाएँ और क्षमता
Aspose.OCR for Python via .NET .NET के माध्यम से पायथन के लिए aspose.ocr अपने कार्यों को तेज और आसान हल करता है।
फोटो ओसीआर
स्कैन-स्तरीय सटीकता के साथ स्मार्टफोन तस्वीरों से पाठ निकालें।
खोज योग्य पीडीएफ
किसी भी स्कैन को पूरी तरह से खोज योग्य, सूचकांक और संपादन योग्य दस्तावेज़ में परिवर्तित करें।
URL मान्यता
स्थानीय रूप से डाउनलोड किए बिना URL से एक छवि को पहचानें।
थोक मान्यता
बहु-पृष्ठ दस्तावेज़, फ़ोल्डर और अभिलेखागार से सभी चित्र पढ़ें।
कोई भी फ़ॉन्ट और शैली
सभी लोकप्रिय टाइपफेस और शैलियों में पाठ को पहचानें और पहचानें।
ठीक धुन मान्यता
सर्वोत्तम मान्यता परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।
बानान चेकर
गलत शब्दों को स्वचालित रूप से सही करके परिणामों में सुधार करें।
छवियों में पाठ खोजें
छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति के लिए खोजें।
छवि ग्रंथों की तुलना करें
मामले और लेआउट की परवाह किए बिना, दो छवियों पर ग्रंथों की तुलना करें।
पायथन कोड नमूने
अपने पायथन अनुप्रयोगों में ओसीआर को मूल रूप से एकीकृत करने के लिए कोड नमूनों में देरी करें।
इंस्टालेशन
एक पायथन व्हील या स्व-निहित डाउनलोड करने योग्य पैकेज के रूप में वितरित, .NET के माध्यम से पायथन के लिए aspose.ocr आसानी से वितरित किया जाता है। अपने पायथन प्रोजेक्ट में एकीकरण, सीधे आपके पसंदीदा पायथन इंटीग्रेटेड डेवलपमेंट वातावरण (आईडीई) से, एक सहज प्रक्रिया है। बस इसे स्थापित करें, और आप OCR क्षमताओं की पूरी श्रृंखला का लाभ उठाने के लिए तैयार हैं, विभिन्न स्वरूपों में मान्यता परिणामों को सहेजते हैं।
पोस्ट-इंस्टॉलेशन, आप तुरंत aspose.ocr के लिए aspose.net के लिए .NET के माध्यम से, कुछ सीमाओं के साथ शुरू कर सकते हैं। एक अस्थायी लाइसेंस 30 दिनों के लिए सभी परीक्षण संस्करण प्रतिबंधों को उठाता है। पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को शुरू करने के लिए इस अवधि का उपयोग करें, जिससे आप बाद में एक चरण में .NET के माध्यम से पायथन के लिए Aspose.Coper पर एक सूचित निर्णय लेने की अनुमति दे सकते हैं।
भार लाइसेंस
lic = License()
lic.set_license(self.licPath)
तस्वीरों पर पाठ को पहचानें
पायथन के लिए Aspose OCR में किसी भी सामग्री से पाठ पढ़ना एक सार्वभौमिक मान्यता विधि कहने के रूप में आसान है।
फोटो को टेक्स्ट में कन्वर्ट करें - पायथन
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
पायथन यूनिवर्सल कनवर्टर
हमारी एपीआई ने स्कैनर, कैमरा, या स्मार्टफोन: पीडीएफ डॉक्यूमेंट्स, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी इमेज और यहां तक कि डीजेवीयू फाइलों से किसी भी छवि को पढ़ा है। मल्टी-पेज पीडीएफ दस्तावेजों, टीआईएफएफ और डीजेवीयू छवियों के लिए पूर्ण समर्थन बहुमुखी प्रतिभा सुनिश्चित करता है। आप एक URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।
मान्यता परिणाम लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, JSON और XML।
पीडीएफ को पहचानें और विभिन्न आउटपुट प्रारूपों के लिए परिणाम सहेजें - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
अजगर में संसाधन अनुकूलन
ऑप्टिकल चरित्र मान्यता संसाधनों की मांग करती है। हमारी एपीआई क्लासिक समय-मूल्य-गुणवत्ता वाले ट्रायड को संतुलित करने के लिए लचीले तरीके प्रदान करती है:
- पूरी तरह से मान्यता और तेजी से मान्यता के बीच चुनें।
- मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या लाइब्रेरी को प्रोसेसर कोर की संख्या के लिए स्वचालित रूप से स्केल करने की अनुमति दें।
- .NET बैकएंड को गणना को बंद करके CPU को मुक्त करें।
तेजी से मान्यता - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
सिंगल लाइन को पहचानें
यदि आपकी छवि पहले से ही पाठ की एक पंक्ति में छंटनी की गई है, तो इसे स्वचालित सुधार, सामग्री संरचना का पता लगाने और अन्य संसाधन-उपभोग करने वाले चरणों के बिना, सबसे तेज़ संभव मोड में पहचाना जा सकता है। यह सामान्य मान्यता प्रक्रिया की तुलना में OCR को 7 गुना तेजी से तेज कर सकता है।
छवि पर पाठ की एकल लाइन को पहचानें - पायथन
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)