.Net के माध्यम से पायथन के लिए क्यों aspose.ocr?

.NET के माध्यम से पायथन के लिए Aspose OCR के साथ एक यात्रा पर-एक बहुमुखी और उपयोगकर्ता के अनुकूल OCR API। अपने पायथन अनुप्रयोगों में OCR कार्यक्षमता को 5 से कम कोड के साथ एम्बेड करें, जटिल गणित या तंत्रिका नेटवर्क की आवश्यकता को समाप्त कर दें। हमारा शक्तिशाली ओसीआर इंजन अंग्रेजी, सिरिलिक, अरबी, फारसी, हिंदी, चीनी, जापानी, कोरियाई, तमिल और कई और अधिक सहित 140+ भाषाओं का समर्थन करते हुए, अद्वितीय गति और सटीकता प्रदान करता है। चाहे वह स्कैन की गई छवियों, स्मार्टफोन फ़ोटो, स्क्रीनशॉट, या स्कैन की गई पीडीएफ, लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में परिणाम प्राप्त करें। घुमाए गए, तिरछे और शोर छवियों को संभालने के लिए लीवरेज प्री-प्रोसेसिंग फिल्टर।

Illustration ocr

कुशल और सटीक ओसीआर

उन्नत पायथन तकनीक के साथ ओसीआर परिणामों में अद्वितीय गति और सटीकता का अनुभव करें।

बहुभाषी

140+ भाषाओं में पाठ को पहचानें: अंग्रेजी, फ्रेंच, जर्मन, स्पेनिश, रूसी, चीनी, हिंदी, जापानी, कोरियाई, तमिल, अरबी, फारसी, और बहुत कुछ।

सार्वभौमिक

पायथन का उपयोग करके विविध स्रोतों - स्कैनर, कैमरा और स्मार्टफोन से आसानी से छवियों को संसाधित करें।

एशियाई भाषाएँ

चीनी, अरबी, देवनागरी और द्रविड़ियन लिपियों के साथ-साथ मिश्रित भाषा के ग्रंथों की सटीक मान्यता प्राप्त करें।

लेआउट को संरक्षित करना

सटीक पाठ प्रतिनिधित्व के लिए स्रोत स्वरूपण बनाए रखें, और तालिकाओं को पहचानें।

लाइव कोड नमूना

पायथन कोड की सिर्फ तीन पंक्तियों में एक छवि को पाठ में परिवर्तित करें। अपने लिए कोशिश करो!

पहचानने के लिए तैयार पहचानने के लिए तैयार यहां एक फ़ाइल छोड़ें या ब्राउज़ करने के लिए क्लिक करें *

* अपनी फ़ाइलों को अपलोड करके या उस सेवा का उपयोग करके आप हमारे साथ सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.

मान्यता परिणाम
 

छवि को पाठ में परिवर्तित करें

अधिक उदाहरणों की खोज करें >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

अपनी प्राथमिकता चुनें

अपनी आवश्यकताओं के लिए सही पुस्तकालय चुनें। सबसे कुशल समाधान का चयन करने के लिए उपलब्ध एपीआई और उनकी क्षमताओं का अन्वेषण करें।

बहुमुखी प्रतिभा

Python via .NET

आसान विकास, पठनीयता और कोड की रखरखाव
सबसे अधिक सुविधाओं का दावा करता है और सबसे लगातार अपडेट प्राप्त करता है
समग्र गति अन्य प्लेटफार्मों की तुलना में थोड़ी धीमी हो सकती है

वर्दी

Python via Java

किसी भी प्लेटफ़ॉर्म पर एक ही लाइब्रेरी का उपयोग करें
किसी भी डिवाइस पर अपने एप्लिकेशन को मूल रूप से चलाएं
जावा रनटाइम एनवायरनमेंट (JRE) संस्करण 8 या बाद में की आवश्यकता है

प्रदर्शन

Python via C++

मंच की परवाह किए बिना सबसे तेजी से संभव गति
संसाधन प्रबंधन पर नियंत्रण का एक बड़ा सौदा
अनुभवी डेवलपर्स की ओर लक्षित

हर जगह चलता है

नाम के बावजूद, .NET के माध्यम से पायथन के लिए aspose.ocr को लक्ष्य प्लेटफ़ॉर्म पर .NET को स्थापित करने की आवश्यकता नहीं है। स्थापना पैकेज पहले से ही सभी आवश्यक घटकों के साथ आता है और किसी भी प्लेटफ़ॉर्म पर मूल रूप से काम कर सकता है - चाहे वह एक स्थानीय मशीन, वेब सर्वर या क्लाउड हो।

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

समर्थित फ़ाइल स्वरूप

Aspose.OCR for Python via .NET किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/python-net/supported-file-formats/ ) आप एक स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणामों को सहेजा जा सकता है, एक डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।

इमेजिस

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

बैच ओसीआर

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

मान्यता परिणाम

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

इंस्टालेशन

.NET के माध्यम से पायथन के लिए aspose.ocr को न्यूनतम निर्भरता के साथ या डाउनलोड करने योग्य फ़ाइल या pypi पैकेज के रूप में एक पायथन पैकेज के रूप में दिया जाता है। आसानी से इंस्टॉल यह आपके प्रोजेक्ट में है, और आप 140+ भाषाओं में ग्रंथों को पहचानने और विभिन्न प्रारूपों में मान्यता परिणामों को बचाने के लिए तैयार हैं।

एक परीक्षण लाइसेंस का अनुरोध करें बिना किसी सीमा के एक पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को किकस्टार्ट करने के लिए।

पायथन के तहत ocr

हमारी लाइब्रेरी आसानी से एकीकृत हो जाती है, किसी भी प्लेटफ़ॉर्म - डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड पर किसी भी प्लेटफॉर्म पर मूल रूप से चलाने के लिए पायथन एप्लिकेशन को सक्षम करती है।

140+ मान्यता भाषाएँ

हमारी जावा OCR लाइब्रेरी वैश्विक स्तर पर दस्तावेज़ प्रसंस्करण, डेटा निष्कर्षण और सामग्री डिजिटलीकरण के लिए एक सार्वभौमिक समाधान है। यूरोपीय, मध्य-पूर्व और एशियाई लेखन स्क्रिप्ट के एक विशाल सरणी के लिए समर्थन के साथ, यह किसी भी देश और व्यवसाय के लिए अच्छी तरह से अनुकूलित है।

जावा के लिए Aspose OCR बहुभाषी दस्तावेजों में पाठ को पहचानता है, जैसे कि चीनी/अंग्रेजी, अरबी/फ्रेंच, या सिरिलिक/अंग्रेजी। निम्नलिखित भाषाओं का समर्थन किया जाता है:

  • ** विस्तारित लैटिन **: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
  • ** सिरिलिक ** वर्णमाला: रूसी, यूक्रेनी, कजाख, बल्गेरियाई, मिश्रित सिरिलिक/अंग्रेजी ग्रंथों सहित;
  • अरबी, फारसी, उर्दू, अंग्रेजी के साथ मिश्रित ग्रंथों सहित;
  • चीनी, कोरियाई, जापानी, देवनागरी और द्रविड़ियन भाषाएं, जिनमें हिंदी, तमिल, मराठी और अन्य शामिल हैं। मिश्रित भाषा के ग्रंथ भी समर्थित हैं।

शक्तिशाली प्रसंस्करण फ़िल्टर

ऑप्टिकल चरित्र मान्यता की सटीकता और विश्वसनीयता मूल छवि की गुणवत्ता पर अत्यधिक निर्भर है। .NET के माध्यम से पायथन के लिए Aspose OCR पूरी तरह से स्वचालित और मैनुअल इमेज प्रोसेसिंग फिल्टर की एक बड़ी संख्या प्रदान करता है जो OCR इंजन को भेजे जाने से पहले एक छवि को बढ़ाता है:

  • स्वचालित रूप से उल्टा और घुमाई गई छवियों को घुमाएं।
  • उल्टे छवियों का पता लगाएं और सफेद-ऑन-ब्लैक टेक्स्ट निकालें।
  • स्वचालित रूप से गंदगी, धब्बे, खरोंच, चकाचौंध, अवांछित ग्रेडिएंट और अन्य शोर को हटा दें।
  • स्वचालित रूप से छवि कंट्रास्ट को समायोजित करें।
  • स्वचालित रूप से अपस्केल, या मैन्युअल रूप से छवि का आकार बदलें।
  • छवियों को काले और सफेद या ग्रेस्केल में परिवर्तित करें।
  • छवि के संभावित समस्याग्रस्त क्षेत्रों का पता लगाएं और दोष के प्रकार और इसके निर्देशांक पर जानकारी वापस करें।
  • एक छवि में वर्णों की मोटाई बढ़ाएं।
  • अक्षरों के किनारों को संरक्षित करते समय ब्लर शोर छवियां।
  • पेज की वक्रता को सीधा करें और पेज फ़ोटो के लिए कैमरा लेंस विरूपण को ठीक करें।

विशिष्ट दस्तावेज़ प्रकारों के लिए अनुकूलित

.NET के माध्यम से पायथन के लिए Aspose OCR अधिकतम सटीकता के साथ कुछ प्रकार की छवियों से पाठ निकालने के लिए विशेष रूप से प्रशिक्षित तंत्रिका नेटवर्क प्रदान करता है:

अंतर्निहित मंत्र चेकर

यद्यपि हमारी पायथन ओसीआर लाइब्रेरी उच्च मान्यता सटीकता प्रदान करती है, मुद्रण दोष, गंदगी, या गैर-मानक फोंट कुछ पात्रों या शब्दों को गलत तरीके से मान्यता प्राप्त कर सकते हैं। मान्यता परिणामों को और बेहतर बनाने के लिए, आप स्पेल चेकर को चालू कर सकते हैं, जो चयनित मान्यता भाषा के आधार पर वर्तनी त्रुटियों को पाता है और स्वचालित रूप से सही करता है।

यदि मान्यता प्राप्त पाठ में विशेष शब्दावली, संक्षिप्तीकरण और अन्य शब्द शामिल हैं जो सामान्य वर्तनी शब्दकोशों में मौजूद नहीं हैं, तो आप अपनी खुद की शब्द सूची प्रदान कर सकते हैं।

बैच मान्यता

हमारे पायथन ओसीआर एपीआई आपको एक -एक करके छवियों को पहचानने से मुक्त करता है। एक कॉल में कई छवियों को पहचानने के लिए विभिन्न बैच-प्रोसेसिंग विधियों को नियोजित करें:

  • मल्टी-पेज पीडीएफ, टीआईएफएफ और डीजेवीयू फाइलों की मान्यता।
  • एक फ़ोल्डर में सभी फ़ाइलों की मान्यता।
  • एक संग्रह में सभी फ़ाइलों की मान्यता।
  • एक सूची से सभी फ़ाइलों की मान्यता।

नमूना द्वारा सीखना

पायथन के लिए OCR उदाहरण की एक सरणी प्रदान करता है, जो पायथन में लिखा गया है, जिससे आप जल्दी से अपने कार्यों और क्षमताओं से खुद को परिचित कर सकते हैं। अपने पायथन व्यवसाय की जरूरतों को पूरा करने के लिए सिलवाया समाधान बनाने के लिए अंतर्दृष्टि प्राप्त करें।

सुविधाएँ और क्षमता

Aspose.OCR for Python via .NET .NET के माध्यम से पायथन के लिए aspose.ocr अपने कार्यों को तेज और आसान हल करता है।

Feature icon

फोटो ओसीआर

स्कैन-स्तरीय सटीकता के साथ स्मार्टफोन तस्वीरों से पाठ निकालें।

Feature icon

खोज योग्य पीडीएफ

किसी भी स्कैन को पूरी तरह से खोज योग्य, सूचकांक और संपादन योग्य दस्तावेज़ में परिवर्तित करें।

Feature icon

URL मान्यता

स्थानीय रूप से डाउनलोड किए बिना URL से एक छवि को पहचानें।

Feature icon

थोक मान्यता

बहु-पृष्ठ दस्तावेज़, फ़ोल्डर और अभिलेखागार से सभी चित्र पढ़ें।

Feature icon

कोई भी फ़ॉन्ट और शैली

सभी लोकप्रिय टाइपफेस और शैलियों में पाठ को पहचानें और पहचानें।

Feature icon

ठीक धुन मान्यता

सर्वोत्तम मान्यता परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।

Feature icon

बानान चेकर

गलत शब्दों को स्वचालित रूप से सही करके परिणामों में सुधार करें।

Feature icon

छवियों में पाठ खोजें

छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति के लिए खोजें।

Feature icon

छवि ग्रंथों की तुलना करें

मामले और लेआउट की परवाह किए बिना, दो छवियों पर ग्रंथों की तुलना करें।

पायथन कोड नमूने

अपने पायथन अनुप्रयोगों में ओसीआर को मूल रूप से एकीकृत करने के लिए कोड नमूनों में देरी करें।

इंस्टालेशन

एक पायथन व्हील या स्व-निहित डाउनलोड करने योग्य पैकेज के रूप में वितरित, .NET के माध्यम से पायथन के लिए aspose.ocr आसानी से वितरित किया जाता है। अपने पायथन प्रोजेक्ट में एकीकरण, सीधे आपके पसंदीदा पायथन इंटीग्रेटेड डेवलपमेंट वातावरण (आईडीई) से, एक सहज प्रक्रिया है। बस इसे स्थापित करें, और आप OCR क्षमताओं की पूरी श्रृंखला का लाभ उठाने के लिए तैयार हैं, विभिन्न स्वरूपों में मान्यता परिणामों को सहेजते हैं।

पोस्ट-इंस्टॉलेशन, आप तुरंत aspose.ocr के लिए aspose.net के लिए .NET के माध्यम से, कुछ सीमाओं के साथ शुरू कर सकते हैं। एक अस्थायी लाइसेंस 30 दिनों के लिए सभी परीक्षण संस्करण प्रतिबंधों को उठाता है। पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को शुरू करने के लिए इस अवधि का उपयोग करें, जिससे आप बाद में एक चरण में .NET के माध्यम से पायथन के लिए Aspose.Coper पर एक सूचित निर्णय लेने की अनुमति दे सकते हैं।

भार लाइसेंस

lic = License()
lic.set_license(self.licPath)

तस्वीरों पर पाठ को पहचानें

पायथन के लिए Aspose OCR में किसी भी सामग्री से पाठ पढ़ना एक सार्वभौमिक मान्यता विधि कहने के रूप में आसान है।

फोटो को टेक्स्ट में कन्वर्ट करें - पायथन

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

पायथन यूनिवर्सल कनवर्टर

हमारी एपीआई ने स्कैनर, कैमरा, या स्मार्टफोन: पीडीएफ डॉक्यूमेंट्स, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी इमेज और यहां तक कि डीजेवीयू फाइलों से किसी भी छवि को पढ़ा है। मल्टी-पेज पीडीएफ दस्तावेजों, टीआईएफएफ और डीजेवीयू छवियों के लिए पूर्ण समर्थन बहुमुखी प्रतिभा सुनिश्चित करता है। आप एक URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।

मान्यता परिणाम लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, JSON और XML।

पीडीएफ को पहचानें और विभिन्न आउटपुट प्रारूपों के लिए परिणाम सहेजें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

अजगर में संसाधन अनुकूलन

ऑप्टिकल चरित्र मान्यता संसाधनों की मांग करती है। हमारी एपीआई क्लासिक समय-मूल्य-गुणवत्ता वाले ट्रायड को संतुलित करने के लिए लचीले तरीके प्रदान करती है:

  • पूरी तरह से मान्यता और तेजी से मान्यता के बीच चुनें।
  • मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या लाइब्रेरी को प्रोसेसर कोर की संख्या के लिए स्वचालित रूप से स्केल करने की अनुमति दें।
  • .NET बैकएंड को गणना को बंद करके CPU को मुक्त करें।

तेजी से मान्यता - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

सिंगल लाइन को पहचानें

यदि आपकी छवि पहले से ही पाठ की एक पंक्ति में छंटनी की गई है, तो इसे स्वचालित सुधार, सामग्री संरचना का पता लगाने और अन्य संसाधन-उपभोग करने वाले चरणों के बिना, सबसे तेज़ संभव मोड में पहचाना जा सकता है। यह सामान्य मान्यता प्रक्रिया की तुलना में OCR को 7 गुना तेजी से तेज कर सकता है।

छवि पर पाठ की एकल लाइन को पहचानें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)