क्यों java के माध्यम से पायथन के लिए aspose.ocr?

जावा के माध्यम से पायथन के लिए aspose.ocr मूल रूप से अपने क्रॉस-प्लेटफॉर्म पायथन नोटबुक और अनुप्रयोगों में शक्तिशाली ऑप्टिकल चरित्र मान्यता (OCR) क्षमताओं को एकीकृत करता है। हमारे सहज और उच्च गति वाले एपीआई के साथ, आप आसानी से स्कैन, स्क्रीनशॉट, वेब लिंक, या स्मार्टफोन फ़ोटो से पाठ निकाल सकते हैं, परिणाम वितरित कर सकते हैं जो समेकन, विश्लेषण या भंडारण के लिए तैयार हैं। स्कैन की गई छवियों, स्मार्टफोन फ़ोटो, स्क्रीनशॉट, और स्कैन किए गए PDFs को पहचानें, लोकप्रिय दस्तावेज़ प्रारूपों में परिणाम की बचत करें। उन्नत प्री-प्रोसेसिंग फिल्टर घुमाए गए, तिरछे और शोर छवियों को संभालते हैं। GPU को कार्यों को उतारकर प्रदर्शन का अनुकूलन करें।

Illustration ocr

स्विफ्ट और सटीक OCR

जावा तकनीक के माध्यम से हमारे उन्नत पायथन के साथ उच्च गति और सटीक OCR परिणाम प्राप्त करें।

बहुभाषी समर्थन

140+ भाषाओं में पाठ को पहचानें, जिसमें लैटिन, सिरिलिक, अरबी, फारसी, इंडिक, और चीनी स्क्रिप्ट शामिल हैं, जो जावा के माध्यम से अपने पायथन अनुप्रयोगों के लिए बहुमुखी प्रतिभा सुनिश्चित करते हैं।

लचीली छवि समर्थन

जावा के माध्यम से पायथन के साथ स्कैनर, कैमरा और स्मार्टफोन से छवियों को प्रक्रिया करें।

चीनी चरित्र मान्यता में परिशुद्धता

जावा के माध्यम से अपने पायथन परियोजनाओं में सटीक के साथ 6,000 से अधिक चीनी पात्रों को पहचानें।

फ़ॉन्ट शैलियों और स्वरूपण को संरक्षित करें

जावा के माध्यम से अपने पायथन अनुप्रयोगों में मान्यता प्राप्त पाठ के सटीक प्रतिनिधित्व के लिए फ़ॉन्ट शैलियों और स्वरूपण को बनाए रखें।

लाइव कोड नमूना

कोड की केवल तीन पंक्तियों में छवियों से पाठ मान्यता शुरू करें। सादगी का अनुभव करें!

पहचानने के लिए तैयार पहचानने के लिए तैयार यहां एक फ़ाइल छोड़ें या ब्राउज़ करने के लिए क्लिक करें *

* अपनी फ़ाइलों को अपलोड करके या उस सेवा का उपयोग करके आप हमारे साथ सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.

मान्यता परिणाम
 

छवि को पाठ में परिवर्तित करें

और ज्यादा उदाहरण >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

अपनी प्राथमिकता चुनें

अपनी आवश्यकताओं के लिए सही पुस्तकालय चुनें। सबसे कुशल समाधान का चयन करने के लिए उपलब्ध एपीआई और उनकी क्षमताओं का अन्वेषण करें।

बहुमुखी प्रतिभा

Python via .NET

आसान विकास, पठनीयता और कोड की रखरखाव
सबसे अधिक सुविधाओं का दावा करता है और सबसे लगातार अपडेट प्राप्त करता है
समग्र गति अन्य प्लेटफार्मों की तुलना में थोड़ी धीमी हो सकती है

वर्दी

Python via Java

किसी भी प्लेटफ़ॉर्म पर एक ही लाइब्रेरी का उपयोग करें
किसी भी डिवाइस पर अपने एप्लिकेशन को मूल रूप से चलाएं
जावा रनटाइम एनवायरनमेंट (JRE) संस्करण 8 या बाद में की आवश्यकता है

प्रदर्शन

Python via C++

मंच की परवाह किए बिना सबसे तेजी से संभव गति
संसाधन प्रबंधन पर नियंत्रण का एक बड़ा सौदा
अनुभवी डेवलपर्स की ओर लक्षित

जावा बैकेंड संगतता

एक पायथन मॉड्यूल के रूप में डिज़ाइन किया गया, हमारी लाइब्रेरी java का समर्थन करने वाले प्रमुख ऑपरेटिंग सिस्टम में संगतता सुनिश्चित करती है - जिसमें Microsoft Windows, Linux, और MacOS, या क्लाउड प्लेटफॉर्म शामिल हैं। यह आपको एक प्लेटफ़ॉर्म पर एप्लिकेशन विकसित करने में सक्षम बनाता है और किसी भी कोड संशोधनों की आवश्यकता को समाप्त करते हुए, उन्हें दूसरे पर चलाता है।

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

समर्थित फ़ाइल स्वरूप

Aspose.OCR for Python via Java किसी भी [फ़ाइल]के साथ काम कर सकते हैं( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) आप एक स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणामों को सहेजा जा सकता है, एक डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।

इमेजिस

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

बैच ओसीआर

  • Multi-page PDF
  • ZIP
  • Folder

मान्यता परिणाम

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

जावा के माध्यम से पायथन के लिए सहज स्थापना

जावा के माध्यम से पायथन के लिए aspose.ocr को एक पायथन पैकेज के रूप में या न्यूनतम निर्भरता के साथ एक डाउनलोड करने योग्य फ़ाइल के रूप में दिया जाता है। आसानी से इंस्टॉल यह आपके प्रोजेक्ट में है, और आप कई समर्थित भाषाओं में ग्रंथों को पहचानने और विभिन्न स्वरूपों में मान्यता परिणामों को बचाने के लिए तैयार हैं।

एक परीक्षण लाइसेंस का अनुरोध करें बिना किसी सीमा के एक पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को किकस्टार्ट करने के लिए।

पायथन अनुप्रयोगों के लिए शक्तिशाली OCR

हमारी लाइब्रेरी आसानी से एकीकृत हो जाती है, किसी भी प्लेटफ़ॉर्म - डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड पर किसी भी प्लेटफॉर्म पर मूल रूप से चलाने के लिए पायथन एप्लिकेशन को सक्षम करती है।

140+ मान्यता भाषाएँ

हमारे पायथन और जावा ओसीआर एपीआई ने मिश्रित भाषाओं सहित भाषाओं और लोकप्रिय लेखन स्क्रिप्ट के ढेरों को पहचानता है:

लाइब्रेरी में भाषा का पता लगाना छोड़ दें या बढ़ी हुई मान्यता प्रदर्शन और विश्वसनीयता के लिए भाषा को स्वयं परिभाषित करें।

  • ** विस्तारित लैटिन ** वर्णमाला: अंग्रेजी, स्पेनिश, फ्रेंच, इंडोनेशियाई, पुर्तगाली, जर्मन, वियतनामी, तुर्की, इतालवी, पोलिश, और 80+ अधिक;
  • ** सिरिलिक ** वर्णमाला: रूसी, यूक्रेनी, कजाख, सर्बियाई, बेलारूसन, बल्गेरियाई;
  • अरबी, फारसी, उर्दू;
  • हिंदी, मराठी, भोजपुरी और अन्य सहित चीनी और देवनागरी स्क्रिप्ट।

बढ़ाया छवि प्रसंस्करण फ़िल्टर

ऑप्टिकल चरित्र मान्यता की सटीकता मूल छवि की गुणवत्ता पर बहुत अधिक निर्भर करती है। जावा के माध्यम से पायथन के लिए aspose.ocr, OCR इंजन को जमा करने से पहले एक छवि को अनुकूलित करने के लिए स्वचालित और मैनुअल इमेज प्रोसेसिंग दोनों दोनों की एक विस्तृत सरणी प्रदान करता है:

  • स्वचालित रूप से थोड़ी झुकी हुई छवियों को सीधा करें।
  • मैन्युअल रूप से गंभीर रूप से तिरछा छवियों के रोटेशन को सही करें।
  • स्वचालित रूप से गंदगी, धब्बे, खरोंच, चकाचौंध, अवांछित ग्रेडिएंट और अन्य प्रकार के शोर को हटा दें।
  • स्वचालित रूप से छवि कंट्रास्ट को समायोजित करें।
  • स्वचालित रूप से अपस्केल या मैन्युअल रूप से छवि का आकार बदलें।
  • छवियों को काले और सफेद या ग्रेस्केल में परिवर्तित करें।
  • छवि रंगों को उल्टा कर देता है, प्रकाश क्षेत्र को अंधेरे और अंधेरे क्षेत्र प्रकाश दिखाई देते हैं।
  • एक छवि में वर्णों की मोटाई बढ़ाएं।
  • अक्षर किनारों को संरक्षित करते समय ब्लर शोर छवियां।
  • पेज की तस्वीरों में सीधे पेज तिरछी और सही कैमरा लेंस विरूपण।

विभिन्न दस्तावेज़ प्रकारों के लिए एपीआई को निर्दिष्ट किया

जावा के माध्यम से पायथन के लिए aspose.ocr अधिकतम सटीकता के साथ कुछ प्रकार की छवियों से पाठ निकालने के लिए विशेष रूप से प्रशिक्षित तंत्रिका नेटवर्क प्रदान करता है:

  • स्कैन या फोटो खींचे गए आईडी कार्ड और पासपोर्ट।
  • वाहन लाइसेंस प्लेट।
  • चालान।
  • रसीदें।

अंतर्निहित मंत्र चेकर

यद्यपि जावा के माध्यम से पायथन के लिए aspose.ocr उच्च मान्यता सटीकता प्रदान करता है, मुद्रण दोष, गंदगी, या गैर-मानक फोंट कुछ पात्रों या शब्दों को गलत तरीके से मान्यता प्राप्त कर सकते हैं। मान्यता परिणामों को और बेहतर बनाने के लिए, आप स्पेल चेकर को चालू कर सकते हैं, जो चयनित मान्यता भाषा के आधार पर वर्तनी त्रुटियों को पाता है और स्वचालित रूप से सही करता है।

यदि मान्यता प्राप्त पाठ में विशेष शब्दावली, संक्षिप्तीकरण और अन्य शब्द शामिल हैं जो सामान्य वर्तनी शब्दकोशों में मौजूद नहीं हैं, तो आप अपनी खुद की शब्द सूची प्रदान कर सकते हैं।

कुशल बैच मान्यता

हमारा पायथन ओसीआर एपीआई आपको छवि मान्यता को सुव्यवस्थित करने का अधिकार देता है। एक ही कॉल में कई छवियों के कुशल प्रसंस्करण के लिए बहुमुखी बैच-प्रोसेसिंग विधियों का उपयोग करें:

  • मल्टी-पेज पीडीएफ, टीआईएफएफ फ़ाइलों को पहचानें।
  • एक फ़ोल्डर के भीतर सभी फ़ाइलों को संसाधित करें।
  • एक संग्रह में सभी फ़ाइलों के लिए मान्यता को संभालें।
  • एक निर्दिष्ट सूची से छवियों को पहचानें।

अजगर के उदाहरणों के माध्यम से सीखना

विभिन्न प्रकार के पायथन उदाहरणों का अन्वेषण करें, जो आपके OCR समाधान के कार्यों और क्षमताओं को तेजी से समझने में मदद करने के लिए डिज़ाइन किया गया है। आपकी विशिष्ट व्यावसायिक आवश्यकताओं को पूरा करने वाले अनुकूलित समाधान बनाने में जल्दी से अंतर्दृष्टि प्राप्त करें।

सुविधाएँ और क्षमता

Aspose.OCR for Python via Java अजगर के लिए aspose.ocr की उन्नत सुविधाओं का अन्वेषण करें

Feature icon

फोटो ओसीआर

स्कैन-स्तरीय सटीकता के साथ स्मार्टफोन तस्वीरों से पाठ निकालें।

Feature icon

खोज योग्य पीडीएफ

किसी भी स्कैन को पूरी तरह से खोजा और सूचकांक योग्य दस्तावेज़ में बदलें।

Feature icon

URL मान्यता

स्थानीय रूप से डाउनलोड किए बिना URL से एक छवि को पहचानें।

Feature icon

थोक मान्यता

बहु-पृष्ठ दस्तावेज़, फ़ोल्डर और अभिलेखागार से सभी चित्र पढ़ें।

Feature icon

कोई भी फ़ॉन्ट और शैली

सभी लोकप्रिय टाइपफेस और शैलियों में पाठ को पहचानें और पहचानें।

Feature icon

ठीक धुन मान्यता

सर्वोत्तम मान्यता परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।

Feature icon

बानान चेकर

गलत शब्दों को स्वचालित रूप से सही करके परिणामों में सुधार करें।

Feature icon

छवियों में पाठ खोजें

छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति के लिए खोजें।

Feature icon

छवि ग्रंथों की तुलना करें

मामले और लेआउट की परवाह किए बिना, दो छवियों पर ग्रंथों की तुलना करें।

पायथन कोड नमूने

अपने अनुप्रयोगों में जावा के माध्यम से पायथन के लिए मूल रूप से aspose.ocr को एकीकृत करने के लिए कोड नमूनों की खोज करें।

सहज स्थापना

एक पायथन पैकेज या न्यूनतम निर्भरता के साथ एक डाउनलोड करने योग्य फ़ाइल के रूप में, जावा के माध्यम से पायथन के लिए aspose.ocr आसान वितरण सुनिश्चित करता है। इसे अपनी परियोजना में सीधे पायथन से एकीकृत करें, और आप पूरी तरह से ओसीआर क्षमताओं का लाभ उठाने के लिए तैयार हैं, विभिन्न स्वरूपों में मान्यता परिणामों को बचाने के लिए। एक अस्थायी लाइसेंस 30 दिनों के लिए सभी परीक्षण संस्करण प्रतिबंधों को हटा देता है। पूरी तरह से कार्यात्मक OCR एप्लिकेशन के विकास को शुरू करने के लिए इस अवधि का उपयोग करें, जिससे आप बाद में जावा के माध्यम से पायथन के लिए खरीदने के लिए एक सूचित निर्णय लेने की अनुमति दे।

भार लाइसेंस

lic = License()
lic.set_license(self.licPath)

छवि मान्यता

OCR अनुप्रयोगों में प्राथमिक चुनौती अंतिम उपयोगकर्ताओं के लिए स्कैनर की कमी है। हमारी एपीआई, जावा के माध्यम से पायथन के साथ मूल रूप से एकीकृत है, इसमें मजबूत अंतर्निहित छवि पूर्व-प्रसंस्करण फिल्टर हैं जो घुमाए गए, तिरछी और शोर छवियों को संभालते हैं। सभी छवि प्रारूपों के लिए समर्थन के साथ संयुक्त, यह स्मार्टफोन तस्वीरों से भी विश्वसनीय मान्यता की अनुमति देता है। अधिकांश पूर्व-प्रसंस्करण और छवि सुधार स्वचालित हैं, केवल चुनौतीपूर्ण मामलों में आपके हस्तक्षेप की आवश्यकता होती है।

स्वचालित छवि सुधार लागू करें - पायथन

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

पायथन यूनिवर्सल कनवर्टर

हमारी एपीआई ने स्कैनर, कैमरा, या स्मार्टफोन: पीडीएफ डॉक्यूमेंट्स, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी फाइलों से किसी भी छवि को पढ़ा है। मल्टी-पेज पीडीएफ दस्तावेजों, टीआईएफएफ और डीजेवीयू छवियों के लिए पूर्ण समर्थन बहुमुखी प्रतिभा सुनिश्चित करता है। आप एक URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।

मान्यता परिणाम लोकप्रिय दस्तावेज़ और डेटा एक्सचेंज प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, JSON और XML।

पीडीएफ को पहचानें और विभिन्न आउटपुट प्रारूपों के लिए परिणाम सहेजें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

संसाधन उपयोग का अनुकूलन

OCR विरल पाठ और शोर/रंगीन पृष्ठभूमि के साथ छवियों से सामग्री निकालने के लिए एक विशेष मान्यता एल्गोरिथ्म प्रदान करता है। यह विधि निम्नलिखित व्यावसायिक मामलों में OCR सटीकता में काफी सुधार करती है:

  • सड़क की तस्वीरों से पाठ पढ़ें।
  • सड़क छवियों के भीतर सड़क संकेतों और साइनबोर्ड की पहचान करें।
  • मूल्य टैग का पता लगाएं और निकाले गए पाठ को कीमतों के रूप में व्याख्या करें।
  • खाद्य लेबल पर रुचि के क्षेत्रों को खोजें और एकत्रित करें, जैसे कि पोषण संबंधी जानकारी या घटक सूचियाँ।
  • कार लाइसेंस प्लेटों को पहचानें और उनका विश्लेषण करें।
  • मेनू और कैटलॉग से पाठ निकालें।

ओपन एरिया ओसीआर - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

सड़क की तस्वीरों से पाठ निकालना

पायथन के लिए OCR एक विशेष मान्यता एल्गोरिथ्म प्रदान करता है जो वाहन लाइसेंस प्लेटों से पाठ निकालता है, जिसमें अंधेरे और धुंधली तस्वीरें शामिल हैं। परिणामी पाठ तब स्वचालित रूप से डेटाबेस में सहेजा जा सकता है या स्वचालित रूप से सत्यापित किया जा सकता है।

कार नंबर को पहचानें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)