Aspose.OCR  for Java

जावा में छवियों और पीडीएफ को टेक्स्ट में बदलें

ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) क्षमताओं के साथ आसानी से क्रॉस-प्लेटफ़ॉर्म जावा एप्लिकेशन बनाएं।

  Download Free Trial
  
 

जावा के लिए Aspose.OCR आपको छवियों, स्क्रीनशॉट, किसी छवि के विशिष्ट क्षेत्रों से टेक्स्ट निकालने और जावा का समर्थन करने वाले किसी भी प्लेटफ़ॉर्म पर स्कैन की गई फ़ाइलों से खोजने योग्य PDF बनाने की अनुमति देता है। अपने शक्तिशाली अभी तक उपयोग में आसान एपीआई के साथ, यहां तक कि जटिल ओसीआर कार्यों में कोड की 10 से कम लाइनें लगती हैं। आपको सूत्रों और मशीन लर्निंग के साथ काम करने की आवश्यकता नहीं है - पुस्तकालय सभी तकनीकी विवरणों का ध्यान रखेगा और लैटिन और सिरिलिक लिपियों के साथ-साथ चीनी के आधार पर 26 भाषाओं में विश्वसनीय परिणाम देगा। ओसीआर एपीआई स्कैन की गई छवियों, स्मार्टफोन फोटो, स्क्रीनशॉट, छवियों के क्षेत्रों, और स्कैन किए गए पीडीएफ को संसाधित करता है और सबसे लोकप्रिय दस्तावेज़ प्रारूपों में परिणाम लौटाता है। कई सीपीयू कोर में गणना वितरित करके और जीपीयू को संसाधन-गहन कार्यों को ऑफलोड करके पहचान की गति, सटीकता और प्रदर्शन में और सुधार किया जा सकता है।

जावा के लिए Aspose.OCR की विशेषताएं और क्षमताएं

स्कैन की गई छवियों और PDF में स्वरूपित पाठ को पहचानता है

सभी फ़ाइल स्वरूपों का समर्थन करता है जिन्हें आप स्कैनर या कैमरा से प्राप्त कर सकते हैं

लैटिन और सिरिलिक लिपियों को पढ़ता है

6,000 से अधिक चीनी अक्षरों को पहचानता है

सभी लोकप्रिय टाइपफेस का पता लगाता है और पहचानता है

फ़ॉन्ट शैलियों और स्वरूपण को सावधानीपूर्वक संरक्षित करता है

पूरी छवि या केवल चयनित क्षेत्रों को संसाधित करता है

घुमावदार, तिरछी और शोर छवियों का समर्थन करता है

किसी फ़ोल्डर या संग्रह में सभी छवियों की बैच पहचान

वेब लिंक के रूप में प्रदान की गई छवियों को पहचानता है

गलत वर्तनी वाले शब्दों को ढूंढता है और स्वचालित रूप से सुधारता है

अन्य Aspose उत्पादों के साथ 100% संगतता

इन्सटाल करना आसान

आप सरल इंस्टॉलेशन निर्देशों का पालन करके सीधे मावेन आधारित प्रोजेक्ट से जावा के लिए Aspose.OCR का उपयोग कर सकते हैं।

बिना किसी सीमा और प्रतिबंध के पूरी तरह कार्यात्मक ओसीआर एप्लिकेशन का निर्माण शुरू करने के लिए एक अस्थायी लाइसेंस का अनुरोध करें।

$Easy to Use$

छवि पहचान के लिए कोड की कुछ पंक्तियों की आवश्यकता होती है। वस्तुत। यह वास्तव में इतना आसान है - स्वयं प्रयास करें:

7 पंक्तियों में पाठ के लिए छवि - जावा

// ओसीआर एपीआई का उदाहरण बनाएं
AsposeOCR api = new AsposeOCR();

try {
    // छवि को पहचानें
    String result = api.RecognizePage(imagePath);
    // मान्यता परिणाम प्रदर्शित करें
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // त्रुटि प्रबंधन
    e.printStackTrace();
}

26 मान्यता भाषाएँ

OCR API मिश्रित भाषाओं वाले टेक्स्ट सहित बड़ी संख्या में भाषाओं और सभी लोकप्रिय लेखन लिपियों का समर्थन करता है। अंतर्निहित वर्तनी परीक्षक स्वचालित रूप से गलत वर्तनी वाले शब्दों को बदल देता है और आपको पहचान परिणामों को मैन्युअल रूप से सही करने की परेशानी से बचाता है।

  • विस्तारित लैटिन वर्णमाला : क्रोएशियाई, चेक, डेनिश, डच, अंग्रेजी, एस्टोनियाई, फिनिश, फ्रेंच, जर्मन, इतालवी, लातवियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, पुर्तगाली, रोमानियाई, स्लोवाक, स्लोवेनियाई, स्पेनिश, स्वीडिश।
  • सिरिलिक वर्णमाला : बेलारूसी, बल्गेरियाई, कज़ाख, रूसी, सर्बियाई, यूक्रेनी।
  • चीनी : 6,000 से अधिक वर्ण।

आप पहचान प्रदर्शन और विश्वसनीयता बढ़ाने के लिए भाषा निर्दिष्ट कर सकते हैं या एपीआई को स्वचालित रूप से भाषाओं का पता लगाने दे सकते हैं।

स्वरूपण संरक्षित करें

ओसीआर एपीआई सभी लोकप्रिय टाइपफेस जैसे एरियल, टाइम्स न्यू रोमन, कूरियर न्यू, ताहोमा, कैलिब्री और अधिक को नियमित, बोल्ड और इटैलिक शैलियों में पढ़ता है और ओसीआर परिणामों में स्वरूपण को ध्यान से संरक्षित करता है। आप पहचान परिणामों को पंक्तियों में विभाजित कर सकते हैं और किसी पृष्ठ में टेक्स्ट क्षेत्रों का पता लगा सकते हैं।

तस्वीरों को पहचानें

स्कैनर हमेशा अंतिम उपयोगकर्ता वर्कस्टेशन पर उपलब्ध नहीं होता है, जो ओसीआर अनुप्रयोगों के लिए शोस्टॉपर बन सकता है। हमारा OCR API कई प्री-प्रोसेसिंग फ़िल्टर प्रदान करता है जो विकृत, घुमाए गए, तिरछे और शोर वाली छवियों को संभाल सकता है। सभी छवि प्रारूपों के समर्थन के संयोजन में, यह स्मार्टफोन की तस्वीरों की भी विश्वसनीय पहचान की अनुमति देता है। अधिकांश पूर्व-प्रसंस्करण और छवि सुधार स्वचालित रूप से किया जाता है, लेकिन आप हमेशा कठिन मामलों में हस्तक्षेप कर सकते हैं।

छवि सुधार लागू करें - जावा

// ओसीआर एपीआई का उदाहरण बनाएं
AsposeOCR api = new AsposeOCR();

// प्री-प्रोसेसिंग फ़िल्टर को परिभाषित करें
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// मान्यता से पहले पूर्व-प्रक्रिया छवि
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// छवि को पहचानें
RecognitionResult result = api.RecognizePage(imageRes, set);

प्रदर्शन अनुकूलन

ऑप्टिकल कैरेक्टर रिकग्निशन के लिए बहुत सारे प्रोसेसिंग संसाधनों की आवश्यकता होती है, जो वेब सेवाओं और प्रवेश स्तर के उपकरणों के लिए एक समस्या बन सकती है। एपीआई मान्यता गति, संसाधन आवश्यकताओं और सटीकता को संतुलित करने के लिए बहुत ही लचीले तरीके प्रदान करता है:

  • पूरी तरह से पहचान और तेजी से पहचान के बीच चयन करें।
  • मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या लाइब्रेरी को सीपीयू कोर की संख्या को स्वचालित रूप से स्केल करने की अनुमति दें।
  • गणना को GPU पर लोड करके CPU को मुक्त करें।

तेजी से पहचान - जावा

// ओसीआर एपीआई का उदाहरण बनाएं
AsposeOCR api = new AsposeOCR();

// सबसे तेज़ मोड में छवि को पहचानें
String result = api.RecognizePageFast("sample.jpg");

बैच प्रसंस्करण

OCR API आपको विभिन्न बैच प्रोसेसिंग विधियों की पेशकश करके एक बार में प्रत्येक छवि को पहचानने से मुक्त करता है जो आपको एक ही कॉल में कई छवियों को पहचानने की अनुमति देता है:

  • बहु-पृष्ठ पीडीएफ और टीआईएफएफ फाइलों की पहचान।
  • एक संग्रह में सभी फाइलों की पहचान।
  • एक फ़ोल्डर में सभी फाइलों की पहचान।
  
  

Aspose अन्य लोकप्रिय प्रोग्रामिंग भाषाओं के लिए मूल OCR API भी प्रदान करता है: