OCR for Java

OCR for C++

OCR for Python via Java

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via .NET

पायथन ओसीआर लाइब्रेरी

पायथन ओसीआर लाइब्रेरी का उपयोग करके अपने पायथन ऐप में छवियों से ग्रंथों को निकालें। उन्नत पायथन एपीआई कोड के साथ, उन्नत ओसीआर क्षमताओं को अनलॉक करते हुए, छवियों को आसानी से पाठ में बदल दें।

डाउनलोड करना परीक्षण खरीदना

देखें, क्या नया है

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-net

.Net के माध्यम से पायथन के लिए क्यों aspose.ocr?

.NET के माध्यम से पायथन के लिए Aspose OCR के साथ एक यात्रा पर-एक बहुमुखी और उपयोगकर्ता के अनुकूल OCR API। अपने पायथन अनुप्रयोगों में OCR कार्यक्षमता को 5 से कम कोड के साथ एम्बेड करें, जटिल गणित या तंत्रिका नेटवर्क की आवश्यकता को समाप्त कर दें। हमारा शक्तिशाली ओसीआर इंजन अंग्रेजी, सिरिलिक, अरबी, फारसी, हिंदी, चीनी, जापानी, कोरियाई, तमिल और कई और अधिक सहित 140+ भाषाओं का समर्थन करते हुए, अद्वितीय गति और सटीकता प्रदान करता है। चाहे वह स्कैन की गई छवियों, स्मार्टफोन फ़ोटो, स्क्रीनशॉट, या स्कैन की गई पीडीएफ, लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में परिणाम प्राप्त करें। घुमाए गए, तिरछे और शोर छवियों को संभालने के लिए लीवरेज प्री-प्रोसेसिंग फिल्टर।

कुशल और सटीक ओसीआर

उन्नत पायथन तकनीक के साथ ओसीआर परिणामों में अद्वितीय गति और सटीकता का अनुभव करें।

बहुभाषी

140+ भाषाओं में पाठ को पहचानें: अंग्रेजी, फ्रेंच, जर्मन, स्पेनिश, रूसी, चीनी, हिंदी, जापानी, कोरियाई, तमिल, अरबी, फारसी, और बहुत कुछ।

सार्वभौमिक

पायथन का उपयोग करके विविध स्रोतों - स्कैनर, कैमरा और स्मार्टफोन से आसानी से छवियों को संसाधित करें।

एशियाई भाषाएँ

चीनी, अरबी, देवनागरी और द्रविड़ियन लिपियों के साथ-साथ मिश्रित भाषा के ग्रंथों की सटीक मान्यता प्राप्त करें।

लेआउट को संरक्षित करना

सटीक पाठ प्रतिनिधित्व के लिए स्रोत स्वरूपण बनाए रखें, और तालिकाओं को पहचानें।

लाइव कोड नमूना

पायथन कोड की सिर्फ तीन पंक्तियों में एक छवि को पाठ में परिवर्तित करें। अपने लिए कोशिश करो!

पहचानने के लिए तैयार पहचानने के लिए तैयार यहां एक फ़ाइल छोड़ें या ब्राउज़ करने के लिए क्लिक करें *

* अपनी फ़ाइलों को अपलोड करके या उस सेवा का उपयोग करके आप हमारे साथ सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.

मान्यता परिणाम

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

अपनी प्राथमिकता चुनें

अपनी आवश्यकताओं के लिए सही पुस्तकालय चुनें। सबसे कुशल समाधान का चयन करने के लिए उपलब्ध एपीआई और उनकी क्षमताओं का अन्वेषण करें।

Python via .NET

आसान विकास, पठनीयता और कोड की रखरखाव

सबसे अधिक सुविधाओं का दावा करता है और सबसे लगातार अपडेट प्राप्त करता है

समग्र गति अन्य प्लेटफार्मों की तुलना में थोड़ी धीमी हो सकती है

Python via Java

किसी भी प्लेटफ़ॉर्म पर एक ही लाइब्रेरी का उपयोग करें

किसी भी डिवाइस पर अपने एप्लिकेशन को मूल रूप से चलाएं

जावा रनटाइम एनवायरनमेंट (JRE) संस्करण 8 या बाद में की आवश्यकता है

Python via C++

मंच की परवाह किए बिना सबसे तेजी से संभव गति

संसाधन प्रबंधन पर नियंत्रण का एक बड़ा सौदा

अनुभवी डेवलपर्स की ओर लक्षित

हर जगह चलता है

नाम के बावजूद, .NET के माध्यम से पायथन के लिए aspose.ocr को लक्ष्य प्लेटफ़ॉर्म पर .NET को स्थापित करने की आवश्यकता नहीं है। स्थापना पैकेज पहले से ही सभी आवश्यक घटकों के साथ आता है और किसी भी प्लेटफ़ॉर्म पर मूल रूप से काम कर सकता है - चाहे वह एक स्थानीय मशीन, वेब सर्वर या क्लाउड हो।

समर्थित फ़ाइल स्वरूप

Aspose.OCR for Python via .NET किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) आप एक स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणामों को सहेजा जा सकता है, एक डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।

इमेजिस

JPEG
PNG
TIFF
BMP
GIF

बैच ओसीआर

Multi-page PDF
DjVu
ZIP
Folder

मान्यता परिणाम

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

इंस्टालेशन

.NET के माध्यम से पायथन के लिए aspose.ocr को न्यूनतम निर्भरता के साथ या डाउनलोड करने योग्य फ़ाइल या pypi पैकेज के रूप में एक पायथन पैकेज के रूप में दिया जाता है। आसानी से इंस्टॉल यह आपके प्रोजेक्ट में है, और आप 140+ भाषाओं में ग्रंथों को पहचानने और विभिन्न प्रारूपों में मान्यता परिणामों को बचाने के लिए तैयार हैं।

एक परीक्षण लाइसेंस का अनुरोध करें बिना किसी सीमा के एक पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को किकस्टार्ट करने के लिए।

पायथन के तहत ocr

हमारी लाइब्रेरी आसानी से एकीकृत हो जाती है, किसी भी प्लेटफ़ॉर्म - डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड पर किसी भी प्लेटफॉर्म पर मूल रूप से चलाने के लिए पायथन एप्लिकेशन को सक्षम करती है।

140+ मान्यता भाषाएँ

हमारी जावा OCR लाइब्रेरी वैश्विक स्तर पर दस्तावेज़ प्रसंस्करण, डेटा निष्कर्षण और सामग्री डिजिटलीकरण के लिए एक सार्वभौमिक समाधान है। यूरोपीय, मध्य-पूर्व और एशियाई लेखन स्क्रिप्ट के एक विशाल सरणी के लिए समर्थन के साथ, यह किसी भी देश और व्यवसाय के लिए अच्छी तरह से अनुकूलित है।

जावा के लिए Aspose OCR बहुभाषी दस्तावेजों में पाठ को पहचानता है, जैसे कि चीनी/अंग्रेजी, अरबी/फ्रेंच, या सिरिलिक/अंग्रेजी। निम्नलिखित भाषाओं का समर्थन किया जाता है:

** विस्तारित लैटिन **: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
** सिरिलिक ** वर्णमाला: रूसी, यूक्रेनी, कजाख, बल्गेरियाई, मिश्रित सिरिलिक/अंग्रेजी ग्रंथों सहित;
अरबी, फारसी, उर्दू, अंग्रेजी के साथ मिश्रित ग्रंथों सहित;
चीनी, कोरियाई, जापानी, देवनागरी और द्रविड़ियन भाषाएं, जिनमें हिंदी, तमिल, मराठी और अन्य शामिल हैं। मिश्रित भाषा के ग्रंथ भी समर्थित हैं।

शक्तिशाली प्रसंस्करण फ़िल्टर

ऑप्टिकल चरित्र मान्यता की सटीकता और विश्वसनीयता मूल छवि की गुणवत्ता पर अत्यधिक निर्भर है। .NET के माध्यम से पायथन के लिए Aspose OCR पूरी तरह से स्वचालित और मैनुअल इमेज प्रोसेसिंग फिल्टर की एक बड़ी संख्या प्रदान करता है जो OCR इंजन को भेजे जाने से पहले एक छवि को बढ़ाता है:

स्वचालित रूप से उल्टा और घुमाई गई छवियों को घुमाएं।
उल्टे छवियों का पता लगाएं और सफेद-ऑन-ब्लैक टेक्स्ट निकालें।
स्वचालित रूप से गंदगी, धब्बे, खरोंच, चकाचौंध, अवांछित ग्रेडिएंट और अन्य शोर को हटा दें।
स्वचालित रूप से छवि कंट्रास्ट को समायोजित करें।
स्वचालित रूप से अपस्केल, या मैन्युअल रूप से छवि का आकार बदलें।
छवियों को काले और सफेद या ग्रेस्केल में परिवर्तित करें।
छवि के संभावित समस्याग्रस्त क्षेत्रों का पता लगाएं और दोष के प्रकार और इसके निर्देशांक पर जानकारी वापस करें।
एक छवि में वर्णों की मोटाई बढ़ाएं।
अक्षरों के किनारों को संरक्षित करते समय ब्लर शोर छवियां।
पेज की वक्रता को सीधा करें और पेज फ़ोटो के लिए कैमरा लेंस विरूपण को ठीक करें।

विशिष्ट दस्तावेज़ प्रकारों के लिए अनुकूलित

.NET के माध्यम से पायथन के लिए Aspose OCR अधिकतम सटीकता के साथ कुछ प्रकार की छवियों से पाठ निकालने के लिए विशेष रूप से प्रशिक्षित तंत्रिका नेटवर्क प्रदान करता है:

अंतर्निहित मंत्र चेकर

यद्यपि हमारी पायथन ओसीआर लाइब्रेरी उच्च मान्यता सटीकता प्रदान करती है, मुद्रण दोष, गंदगी, या गैर-मानक फोंट कुछ पात्रों या शब्दों को गलत तरीके से मान्यता प्राप्त कर सकते हैं। मान्यता परिणामों को और बेहतर बनाने के लिए, आप स्पेल चेकर को चालू कर सकते हैं, जो चयनित मान्यता भाषा के आधार पर वर्तनी त्रुटियों को पाता है और स्वचालित रूप से सही करता है।

यदि मान्यता प्राप्त पाठ में विशेष शब्दावली, संक्षिप्तीकरण और अन्य शब्द शामिल हैं जो सामान्य वर्तनी शब्दकोशों में मौजूद नहीं हैं, तो आप अपनी खुद की शब्द सूची प्रदान कर सकते हैं।

बैच मान्यता

हमारे पायथन ओसीआर एपीआई आपको एक -एक करके छवियों को पहचानने से मुक्त करता है। एक कॉल में कई छवियों को पहचानने के लिए विभिन्न बैच-प्रोसेसिंग विधियों को नियोजित करें:

मल्टी-पेज पीडीएफ, टीआईएफएफ और डीजेवीयू फाइलों की मान्यता।
एक फ़ोल्डर में सभी फ़ाइलों की मान्यता।
एक संग्रह में सभी फ़ाइलों की मान्यता।
एक सूची से सभी फ़ाइलों की मान्यता।

नमूना द्वारा सीखना

पायथन के लिए OCR उदाहरण की एक सरणी प्रदान करता है, जो पायथन में लिखा गया है, जिससे आप जल्दी से अपने कार्यों और क्षमताओं से खुद को परिचित कर सकते हैं। अपने पायथन व्यवसाय की जरूरतों को पूरा करने के लिए सिलवाया समाधान बनाने के लिए अंतर्दृष्टि प्राप्त करें।

सुविधाएँ और क्षमता

Aspose.OCR for Python via .NET .NET के माध्यम से पायथन के लिए aspose.ocr अपने कार्यों को तेज और आसान हल करता है।

फोटो ओसीआर

स्कैन-स्तरीय सटीकता के साथ स्मार्टफोन तस्वीरों से पाठ निकालें।

खोज योग्य पीडीएफ

किसी भी स्कैन को पूरी तरह से खोज योग्य, सूचकांक और संपादन योग्य दस्तावेज़ में परिवर्तित करें।

URL मान्यता

स्थानीय रूप से डाउनलोड किए बिना URL से एक छवि को पहचानें।

थोक मान्यता

बहु-पृष्ठ दस्तावेज़, फ़ोल्डर और अभिलेखागार से सभी चित्र पढ़ें।

कोई भी फ़ॉन्ट और शैली

सभी लोकप्रिय टाइपफेस और शैलियों में पाठ को पहचानें और पहचानें।

ठीक धुन मान्यता

सर्वोत्तम मान्यता परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।

बानान चेकर

गलत शब्दों को स्वचालित रूप से सही करके परिणामों में सुधार करें।

छवियों में पाठ खोजें

छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति के लिए खोजें।

छवि ग्रंथों की तुलना करें

मामले और लेआउट की परवाह किए बिना, दो छवियों पर ग्रंथों की तुलना करें।

पायथन कोड नमूने

अपने पायथन अनुप्रयोगों में ओसीआर को मूल रूप से एकीकृत करने के लिए कोड नमूनों में देरी करें।

इंस्टालेशन

एक पायथन व्हील या स्व-निहित डाउनलोड करने योग्य पैकेज के रूप में वितरित, .NET के माध्यम से पायथन के लिए aspose.ocr आसानी से वितरित किया जाता है। अपने पायथन प्रोजेक्ट में एकीकरण, सीधे आपके पसंदीदा पायथन इंटीग्रेटेड डेवलपमेंट वातावरण (आईडीई) से, एक सहज प्रक्रिया है। बस इसे स्थापित करें, और आप OCR क्षमताओं की पूरी श्रृंखला का लाभ उठाने के लिए तैयार हैं, विभिन्न स्वरूपों में मान्यता परिणामों को सहेजते हैं।

पोस्ट-इंस्टॉलेशन, आप तुरंत aspose.ocr के लिए aspose.net के लिए .NET के माध्यम से, कुछ सीमाओं के साथ शुरू कर सकते हैं। एक अस्थायी लाइसेंस 30 दिनों के लिए सभी परीक्षण संस्करण प्रतिबंधों को उठाता है। पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को शुरू करने के लिए इस अवधि का उपयोग करें, जिससे आप बाद में एक चरण में .NET के माध्यम से पायथन के लिए Aspose.Coper पर एक सूचित निर्णय लेने की अनुमति दे सकते हैं।

भार लाइसेंस

lic = License()
lic.set_license(self.licPath)

तस्वीरों पर पाठ को पहचानें

पायथन के लिए Aspose OCR में किसी भी सामग्री से पाठ पढ़ना एक सार्वभौमिक मान्यता विधि कहने के रूप में आसान है।

फोटो को टेक्स्ट में कन्वर्ट करें - पायथन

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

पायथन यूनिवर्सल कनवर्टर

हमारी एपीआई ने स्कैनर, कैमरा, या स्मार्टफोन: पीडीएफ डॉक्यूमेंट्स, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी इमेज और यहां तक कि डीजेवीयू फाइलों से किसी भी छवि को पढ़ा है। मल्टी-पेज पीडीएफ दस्तावेजों, टीआईएफएफ और डीजेवीयू छवियों के लिए पूर्ण समर्थन बहुमुखी प्रतिभा सुनिश्चित करता है। आप एक URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।

मान्यता परिणाम लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, JSON और XML।

पीडीएफ को पहचानें और विभिन्न आउटपुट प्रारूपों के लिए परिणाम सहेजें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

अजगर में संसाधन अनुकूलन

ऑप्टिकल चरित्र मान्यता संसाधनों की मांग करती है। हमारी एपीआई क्लासिक समय-मूल्य-गुणवत्ता वाले ट्रायड को संतुलित करने के लिए लचीले तरीके प्रदान करती है:

पूरी तरह से मान्यता और तेजी से मान्यता के बीच चुनें।
मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या लाइब्रेरी को प्रोसेसर कोर की संख्या के लिए स्वचालित रूप से स्केल करने की अनुमति दें।
.NET बैकएंड को गणना को बंद करके CPU को मुक्त करें।

तेजी से मान्यता - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

सिंगल लाइन को पहचानें

यदि आपकी छवि पहले से ही पाठ की एक पंक्ति में छंटनी की गई है, तो इसे स्वचालित सुधार, सामग्री संरचना का पता लगाने और अन्य संसाधन-उपभोग करने वाले चरणों के बिना, सबसे तेज़ संभव मोड में पहचाना जा सकता है। यह सामान्य मान्यता प्रक्रिया की तुलना में OCR को 7 गुना तेजी से तेज कर सकता है।

छवि पर पाठ की एकल लाइन को पहचानें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)

पायथन ओसीआर लाइब्रेरी

पायथन ओसीआर के साथ छवियों को पाठ में परिवर्तित करें

.Net के माध्यम से पायथन के लिए क्यों aspose.ocr?

कुशल और सटीक ओसीआर

बहुभाषी

सार्वभौमिक

एशियाई भाषाएँ

लेआउट को संरक्षित करना

लाइव कोड नमूना

छवि को पाठ में परिवर्तित करें

अपनी प्राथमिकता चुनें

बहुमुखी प्रतिभा

वर्दी

प्रदर्शन

हर जगह चलता है

समर्थित फ़ाइल स्वरूप

इमेजिस

बैच ओसीआर

मान्यता परिणाम

इंस्टालेशन

पायथन के तहत ocr

140+ मान्यता भाषाएँ

शक्तिशाली प्रसंस्करण फ़िल्टर

विशिष्ट दस्तावेज़ प्रकारों के लिए अनुकूलित

अंतर्निहित मंत्र चेकर

बैच मान्यता

नमूना द्वारा सीखना

सुविधाएँ और क्षमता

पायथन कोड नमूने

इंस्टालेशन

भार लाइसेंस

तस्वीरों पर पाठ को पहचानें

फोटो को टेक्स्ट में कन्वर्ट करें - पायथन

पायथन यूनिवर्सल कनवर्टर

पीडीएफ को पहचानें और विभिन्न आउटपुट प्रारूपों के लिए परिणाम सहेजें - पायथन

अजगर में संसाधन अनुकूलन

तेजी से मान्यता - पायथन

सिंगल लाइन को पहचानें

छवि पर पाठ की एकल लाइन को पहचानें - पायथन

रेडी स्टेडी गो!

समर्थन और सीखना

एपीआई का अन्वेषण करें

समर्थन प्राप्त करें

विज्ञप्ति