जावा के माध्यम से पायथन के लिए Aspose.OCR क्यों?

जावा के माध्यम से पायथन के लिए Aspose.OCR आपके क्रॉस-प्लेटफ़ॉर्म पायथन नोटबुक और एप्लिकेशन में शक्तिशाली ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) क्षमताओं को सहजता से एकीकृत करता है। हमारे सहज और हाई-स्पीड एपीआई के साथ, आप आसानी से स्कैन, स्क्रीनशॉट, वेब लिंक या स्मार्टफोन फोटो से टेक्स्ट निकाल सकते हैं, जो समेकन, विश्लेषण या भंडारण के लिए तैयार परिणाम प्रदान करते हैं। स्कैन की गई छवियों, स्मार्टफोन फ़ोटो, स्क्रीनशॉट और स्कैन किए गए पीडीएफ को पहचानें, लोकप्रिय दस्तावेज़ प्रारूपों में परिणाम सहेजें। उन्नत प्री-प्रोसेसिंग फ़िल्टर घुमाई गई, तिरछी और शोर वाली छवियों को संभालते हैं। कार्यों को GPU पर लोड करके प्रदर्शन को अनुकूलित करें।

Illustration ocr

तेज़ और सटीक ओसीआर

जावा प्रौद्योगिकी के माध्यम से हमारे उन्नत पायथन के साथ उच्च गति और सटीक ओसीआर परिणाम प्राप्त करें।

बहुभाषी समर्थन

लैटिन, सिरिलिक और चीनी लिपियों सहित 28 भाषाओं में पाठ को पहचानें, जिससे जावा के माध्यम से आपके पायथन अनुप्रयोगों की बहुमुखी प्रतिभा सुनिश्चित हो सके।

लचीला छवि समर्थन

जावा के माध्यम से पायथन के साथ स्कैनर, कैमरे और स्मार्टफ़ोन से छवियों को सहजता से संसाधित करें।

चीनी चरित्र पहचान में परिशुद्धता

जावा के माध्यम से अपने पायथन प्रोजेक्ट्स में 6,000 से अधिक चीनी अक्षरों को सटीकता से पहचानें।

फ़ॉन्ट शैलियाँ और फ़ॉर्मेटिंग सुरक्षित रखें

जावा के माध्यम से अपने पायथन अनुप्रयोगों में मान्यता प्राप्त पाठ के सटीक प्रतिनिधित्व के लिए फ़ॉन्ट शैली और स्वरूपण बनाए रखें।

लाइव कोड नमूना

कोड की केवल तीन पंक्तियों में छवियों से पाठ पहचान आरंभ करें। सरलता का अनुभव करें!

पहचानने को तैयार पहचानने को तैयार एक फ़ाइल यहां छोड़ें या ब्राउज़ करने के लिए क्लिक करें*

* अपनी फ़ाइलें अपलोड करके या सेवा का उपयोग करके आप हमारी बात से सहमत हैं उपयोग की शर्तें और गोपनीयता नीति.

मान्यता परिणाम
 

छवि को टेक्स्ट में बदलें

और ज्यादा उदाहरण >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

जावा बैकएंड संगतता

पायथन मॉड्यूल के रूप में डिज़ाइन की गई, हमारी लाइब्रेरी जावा को सपोर्ट करने वाले प्रमुख ऑपरेटिंग सिस्टम में अनुकूलता सुनिश्चित करती है - जिसमें माइक्रोसॉफ्ट विंडोज, लिनक्स और मैकओएस या क्लाउड प्लेटफ़ॉर्म. यह आपको किसी भी कोड संशोधन की आवश्यकता को समाप्त करते हुए, एक प्लेटफ़ॉर्म पर एप्लिकेशन विकसित करने और उन्हें दूसरे पर निर्बाध रूप से चलाने में सक्षम बनाता है।

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

समर्थित फ़ाइल स्वरूप

Aspose.OCR for Python via Java वस्तुतः किसी भी [फ़ाइल]के साथ काम कर सकता है( https://docs.aspose.com/ocr/python-java/supported-file-formats/ ) आप स्कैनर या कैमरे से प्राप्त कर सकते हैं। मान्यता परिणाम सबसे लोकप्रिय फ़ाइल और डेटा विनिमय प्रारूपों में लौटाए जाते हैं जिन्हें सहेजा जा सकता है, डेटाबेस में आयात किया जा सकता है, या वास्तविक समय में विश्लेषण किया जा सकता है।

इमेजिस

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

बैच ओसीआर

  • Multi-page PDF
  • ZIP
  • Folder

मान्यता परिणाम

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

जावा के माध्यम से पायथन के लिए सरल इंस्टालेशन

जावा के माध्यम से पायथन के लिए Aspose.OCR को न्यूनतम निर्भरता के साथ पायथन पैकेज या डाउनलोड करने योग्य फ़ाइल के रूप में वितरित किया जाता है। आसानी से इसे अपने प्रोजेक्ट में इंस्टॉल करें ( https://docs.aspose.com/ocr/python-java/installation/) , और आप कई समर्थित भाषाओं में टेक्स्ट को पहचानने और विभिन्न प्रारूपों में पहचान परिणामों को सहेजने के लिए तैयार हैं।

एक परीक्षण लाइसेंस का अनुरोध करें बिना किसी सीमा के पूरी तरह कार्यात्मक ओसीआर एप्लिकेशन के विकास को शुरू करने के लिए।

पायथन अनुप्रयोगों के लिए शक्तिशाली ओसीआर

हमारी लाइब्रेरी आसानी से एकीकृत हो जाती है, जिससे पायथन एप्लिकेशन किसी भी प्लेटफॉर्म - डेस्कटॉप विंडोज, विंडोज सर्वर, मैकओएस, लिनक्स और क्लाउड पर निर्बाध रूप से चलने में सक्षम हो जाते हैं।

28 मान्यता भाषाएँ

हमारा पायथन और जावा ओसीआर एपीआई मिश्रित भाषाओं सहित कई भाषाओं और लोकप्रिय लेखन स्क्रिप्ट को पहचानता है:

उन्नत पहचान प्रदर्शन और विश्वसनीयता के लिए भाषा का पता लगाने को लाइब्रेरी पर छोड़ दें या स्वयं भाषा को परिभाषित करें।

  • विस्तारित लैटिन वर्णमाला: क्रोएशियाई, चेक, डेनिश, डच, अंग्रेजी, एस्टोनियाई, फिनिश, फ्रेंच, जर्मन, इतालवी, लातवियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, पुर्तगाली, रोमानियाई, स्लोवाक, स्लोवेनियाई, स्पेनिश, स्वीडिश;
  • सिरिलिक वर्णमाला: बेलोरूसियन, बल्गेरियाई, कज़ाख, रूसी, सर्बियाई, यूक्रेनी;
  • चीनी: 6,000 से अधिक अक्षर;
  • हिंदी

उन्नत छवि प्रसंस्करण फ़िल्टर

ऑप्टिकल कैरेक्टर पहचान की सटीकता मूल छवि की गुणवत्ता पर बहुत अधिक निर्भर करती है। जावा के माध्यम से पायथन के लिए Aspose.OCR, OCR इंजन में सबमिट करने से पहले एक छवि को अनुकूलित करने के लिए स्वचालित और मैन्युअल इमेज प्रोसेसिंग फ़िल्टर दोनों की एक विस्तृत श्रृंखला प्रदान करता है:

  • थोड़ी झुकी हुई छवियों को स्वचालित रूप से सीधा करें।
  • गंभीर रूप से तिरछी छवियों के रोटेशन को मैन्युअल रूप से ठीक करें।
  • गंदगी, धब्बे, खरोंच, चमक, अवांछित ग्रेडियेंट और अन्य प्रकार के शोर को स्वचालित रूप से हटा दें।
  • छवि कंट्रास्ट को स्वचालित रूप से समायोजित करें।
  • छवि को स्वचालित रूप से अपस्केल करें या मैन्युअल रूप से आकार बदलें।
  • छवियों को काले और सफेद या ग्रेस्केल में बदलें।
  • छवि के रंगों को उल्टा करें, जिससे प्रकाश वाले क्षेत्र गहरे और अंधेरे वाले क्षेत्र हल्के दिखाई दें।
  • किसी छवि में वर्णों की मोटाई बढ़ाएँ।
  • अक्षर किनारों को संरक्षित करते हुए शोर वाली छवियों को धुंधला करें।
  • पृष्ठ के तिरछापन को सीधा करें और पृष्ठ फ़ोटो में कैमरा लेंस विरूपण को ठीक करें।

विभिन्न दस्तावेज़ प्रकारों के लिए विशिष्ट एपीआई

जावा के माध्यम से पायथन के लिए Aspose.OCR अधिकतम सटीकता के साथ कुछ प्रकार की छवियों से पाठ निकालने के लिए विशेष रूप से प्रशिक्षित तंत्रिका नेटवर्क प्रदान करता है:

  • स्कैन किए गए या फोटोयुक्त आईडी कार्ड और पासपोर्ट।
  • वाहन लाइसेंस प्लेट.
  • चालान.
  • रसीदें।

अंतर्निर्मित वर्तनी परीक्षक

हालाँकि जावा के माध्यम से पायथन के लिए Aspose.OCR उच्च पहचान सटीकता प्रदान करता है, मुद्रण दोष, गंदगी, या गैर-मानक फ़ॉन्ट के कारण कुछ वर्ण या शब्द गलत पहचाने जा सकते हैं। पहचान परिणामों को और बेहतर बनाने के लिए, आप वर्तनी परीक्षक चालू कर सकते हैं, जो चयनित पहचान भाषा के आधार पर वर्तनी त्रुटियों को ढूंढता है और स्वचालित रूप से ठीक करता है।

यदि मान्यता प्राप्त पाठ में विशेष शब्दावली, संक्षिप्ताक्षर और अन्य शब्द शामिल हैं जो सामान्य वर्तनी शब्दकोशों में मौजूद नहीं हैं, तो आप अपनी स्वयं की शब्द सूची प्रदान कर सकते हैं।

कुशल बैच पहचान

हमारा पायथन ओसीआर एपीआई आपको छवि पहचान को सुव्यवस्थित करने में सक्षम बनाता है। एक ही कॉल में एकाधिक छवियों के कुशल प्रसंस्करण के लिए बहुमुखी बैच-प्रोसेसिंग विधियों का उपयोग करें:

  • बहु-पृष्ठ पीडीएफ, टीआईएफएफ फाइलों को पहचानें।
  • एक फ़ोल्डर के भीतर सभी फ़ाइलों को संसाधित करें।
  • किसी संग्रह में सभी फ़ाइलों के लिए पहचान संभालें।
  • निर्दिष्ट सूची से छवियों को पहचानें।

पायथन उदाहरणों के माध्यम से सीखना

हमारे ओसीआर समाधान के कार्यों और क्षमताओं को तेजी से समझने में आपकी सहायता के लिए डिज़ाइन किए गए विभिन्न प्रकार के पायथन उदाहरण का अन्वेषण करें। आपकी विशिष्ट व्यावसायिक आवश्यकताओं को पूरा करने वाले अनुकूलित समाधान बनाने के बारे में तुरंत जानकारी प्राप्त करें।

विशेषताएँ एवं क्षमताएँ

Aspose.OCR for Python via Java Python के लिए Aspose.OCR की उन्नत सुविधाओं का अन्वेषण करें

Feature icon

फोटो ओसीआर

स्कैन-स्तरीय सटीकता के साथ स्मार्टफ़ोन फ़ोटो से टेक्स्ट निकालें।

Feature icon

खोजने योग्य पीडीएफ

किसी भी स्कैन को पूरी तरह से खोजने योग्य और अनुक्रमणिका योग्य दस्तावेज़ में परिवर्तित करें।

Feature icon

यूआरएल पहचान

किसी छवि को स्थानीय रूप से डाउनलोड किए बिना URL से पहचानें।

Feature icon

थोक मान्यता

बहु-पृष्ठ दस्तावेज़ों, फ़ोल्डरों और संग्रहों से सभी छवियां पढ़ें।

Feature icon

कोई भी फ़ॉन्ट और शैली

सभी लोकप्रिय टाइपफेस और शैलियों में टेक्स्ट को पहचानें और पहचानें।

Feature icon

उत्तम धुन पहचान

सर्वोत्तम पहचान परिणामों के लिए प्रत्येक OCR पैरामीटर को समायोजित करें।

Feature icon

बानान चेकर

गलत वर्तनी वाले शब्दों को स्वचालित रूप से ठीक करके परिणामों में सुधार करें।

Feature icon

छवियों में टेक्स्ट ढूंढें

छवियों के एक सेट के भीतर पाठ या नियमित अभिव्यक्ति खोजें।

Feature icon

छवि पाठ की तुलना करें

केस और लेआउट की परवाह किए बिना, दो छवियों पर टेक्स्ट की तुलना करें।

पायथन कोड नमूने

अपने अनुप्रयोगों में जावा के माध्यम से पायथन के लिए Aspose.OCR को सहजता से एकीकृत करने के लिए कोड नमूने खोजें।

सहज स्थापना

पायथन पैकेज या न्यूनतम निर्भरता वाली डाउनलोड करने योग्य फ़ाइल के रूप में, जावा के माध्यम से पायथन के लिए Aspose.OCR आसान वितरण सुनिश्चित करता है। इसे सीधे पायथन से अपने प्रोजेक्ट में एकीकृत करें, और आप विभिन्न प्रारूपों में पहचान परिणामों को सहेजते हुए पूर्ण ओसीआर क्षमताओं का लाभ उठाने के लिए तैयार हैं।

पोस्ट-इंस्टॉलेशन, तुरंत जावा के माध्यम से पायथन के लिए Aspose.OCR का उपयोग शुरू करें, यद्यपि कुछ सीमाओं के साथ। एक अस्थायी लाइसेंस 30 दिनों के लिए सभी परीक्षण संस्करण प्रतिबंधों को हटा देता है। इस अवधि का उपयोग पूरी तरह कार्यात्मक ओसीआर एप्लिकेशन के विकास को शुरू करने के लिए करें, जिससे आप बाद में जावा के माध्यम से पायथन के लिए Aspose.OCR खरीदने पर एक सूचित निर्णय ले सकें।

लाइसेंस लोड करें

lic = License()
lic.set_license(self.licPath)

छवि पहचान

ओसीआर अनुप्रयोगों में प्राथमिक चुनौती अंतिम उपयोगकर्ताओं के लिए स्कैनर की कमी है। हमारा एपीआई, जावा के माध्यम से पायथन के साथ निर्बाध रूप से एकीकृत है, इसमें घुमाए गए, तिरछे और शोर वाले चित्रों को संभालने के लिए मजबूत अंतर्निहित छवि प्री-प्रोसेसिंग फिल्टर की सुविधा है। सभी छवि प्रारूपों के समर्थन के साथ, यह स्मार्टफोन फ़ोटो से भी विश्वसनीय पहचान की अनुमति देता है। अधिकांश प्री-प्रोसेसिंग और छवि सुधार स्वचालित हैं, केवल चुनौतीपूर्ण मामलों में आपके हस्तक्षेप की आवश्यकता होती है।

स्वचालित छवि सुधार लागू करें - पायथन

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

पायथन यूनिवर्सल कन्वर्टर

हमारा एपीआई स्कैनर, कैमरा या स्मार्टफोन से किसी भी छवि को कुशलता से पढ़ता है: पीडीएफ दस्तावेज़, जेपीईजी, पीएनजी, टीआईएफएफ, जीआईएफ, बीएमपी फाइलें। बहु-पृष्ठ पीडीएफ दस्तावेजों, टीआईएफएफ और डीजेवीयू छवियों के लिए पूर्ण समर्थन बहुमुखी प्रतिभा सुनिश्चित करता है। आप URL के माध्यम से वेब से एक छवि भी प्रदान कर सकते हैं।

पहचान परिणाम लोकप्रिय दस्तावेज़ और डेटा विनिमय प्रारूपों में लौटाए जाते हैं: सादा पाठ, पीडीएफ, माइक्रोसॉफ्ट वर्ड, माइक्रोसॉफ्ट एक्सेल, जेएसओएन और एक्सएमएल।

पीडीएफ को पहचानें और परिणामों को विभिन्न आउटपुट स्वरूपों में सहेजें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

संसाधन उपयोग का अनुकूलन

OCR विरल पाठ और शोर/रंगीन पृष्ठभूमि वाली छवियों से सामग्री निकालने के लिए एक विशेष पहचान एल्गोरिथ्म प्रदान करता है। यह विधि निम्नलिखित व्यावसायिक मामलों में OCR सटीकता में उल्लेखनीय सुधार करती है:

  • सड़क की तस्वीरों से पाठ पढ़ें.
  • सड़क छवियों के भीतर सड़क संकेतों और साइनबोर्डों को विभाजित करें और पहचानें।
  • मूल्य टैग का पता लगाएं और निकाले गए पाठ को कीमतों के रूप में समझें।
  • खाद्य लेबलों पर रुचि के क्षेत्रों को खोजें और एकत्रित करें, जैसे कि पोषण संबंधी जानकारी या घटक सूची।
  • कार लाइसेंस प्लेटों को पहचानें और उनका विश्लेषण करें।
  • मेनू और कैटलॉग से टेक्स्ट निकालें.

खुला क्षेत्र ओसीआर - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

सड़क की तस्वीरों से टेक्स्ट निकाला जा रहा है

पायथन के लिए ओसीआर एक विशेष पहचान एल्गोरिथ्म प्रदान करता है जो अंधेरे और धुंधली तस्वीरों सहित वाहन लाइसेंस प्लेटों से पाठ निकालता है। परिणामी पाठ को स्वचालित रूप से डेटाबेस में सहेजा जा सकता है या स्वचालित रूप से सत्यापित किया जा सकता है।

कार का नंबर पहचानें - पायथन

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)