जावा में छवियों और पीडीएफ को टेक्स्ट में बदलें

ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) क्षमताओं के साथ आसानी से क्रॉस-प्लेटफ़ॉर्म जावा एप्लिकेशन बनाएं।

जावा के लिए Aspose.OCR आपको छवियों, स्क्रीनशॉट, किसी छवि के विशिष्ट क्षेत्रों से टेक्स्ट निकालने और जावा का समर्थन करने वाले किसी भी प्लेटफ़ॉर्म पर स्कैन की गई फ़ाइलों से खोजने योग्य PDF बनाने की अनुमति देता है। अपने शक्तिशाली अभी तक उपयोग में आसान एपीआई के साथ, यहां तक कि जटिल ओसीआर कार्यों में कोड की 10 से कम लाइनें लगती हैं। आपको सूत्रों और मशीन लर्निंग के साथ काम करने की आवश्यकता नहीं है - पुस्तकालय सभी तकनीकी विवरणों का ध्यान रखेगा और लैटिन और सिरिलिक लिपियों के साथ-साथ चीनी के आधार पर 26 भाषाओं में विश्वसनीय परिणाम देगा। ओसीआर एपीआई स्कैन की गई छवियों, स्मार्टफोन फोटो, स्क्रीनशॉट, छवियों के क्षेत्रों, और स्कैन किए गए पीडीएफ को संसाधित करता है और सबसे लोकप्रिय दस्तावेज़ प्रारूपों में परिणाम लौटाता है। कई सीपीयू कोर में गणना वितरित करके और जीपीयू को संसाधन-गहन कार्यों को ऑफलोड करके पहचान की गति, सटीकता और प्रदर्शन में और सुधार किया जा सकता है।

एक नजर में

ऑप्टिकल कैरेक्टर रिकग्निशन क्षमताओं का एक संक्षिप्त सारांश।

समर्थित फ़ॉन्ट्स

Arial
Times New Roman
Courier New
Tahoma
Calibri
Verdana

मान्यता

पूरी छवि
छवि क्षेत्र
अभिलेखागार और फ़ोल्डर्स

समर्थित भाषाएँ

अंग्रेजी भाषा
चीनी भाषा
जर्मन भाषा
फ्रान्सीसी भाषा
स्लोवेनियाई भाषा
स्पेनिश भाषा
चेक भाषा
पोलिश भाषा
रूमानियाई भाषा
हॉलैंड की भाषा
रूसी भाषा
और 10+ अधिक

Aspose.OCR

प्लेटफार्म स्वतंत्रता

Aspose.OCR जावा के लिए JDK 1.6 और इसके बाद के संस्करण का समर्थन करता है।

प्लग-इन

Ruby
PHP
IntelliJ IDEA - Maven

Java Runtime Environment

जेएसपी/जेएसएफ अनुप्रयोग
डेस्कटॉप अनुप्रयोग

Aspose.OCR

समर्थित फ़ाइल प्रारूप

स्कैनर या कैमरे से प्राप्त होने वाली किसी भी फ़ाइल को सबसे लोकप्रिय दस्तावेज़ और डेटा विनिमय स्वरूपों में कनवर्ट करें।

स्रोत फ़ाइलें

PDF
JPEG
PNG
TIFF
GIF
BMP

मान्यता परिणाम

खोजने योग्य पीडीएफ
Microsoft Word
Microsoft Excel
सादे पाठ
JSON
XML

Aspose.OCR

जावा के लिए Aspose.OCR की विशेषताएं और क्षमताएं

स्कैन की गई छवियों और PDF में स्वरूपित पाठ को पहचानता है

सभी फ़ाइल स्वरूपों का समर्थन करता है जिन्हें आप स्कैनर या कैमरा से प्राप्त कर सकते हैं

लैटिन और सिरिलिक लिपियों को पढ़ता है

6,000 से अधिक चीनी अक्षरों को पहचानता है

सभी लोकप्रिय टाइपफेस का पता लगाता है और पहचानता है

फ़ॉन्ट शैलियों और स्वरूपण को सावधानीपूर्वक संरक्षित करता है

पूरी छवि या केवल चयनित क्षेत्रों को संसाधित करता है

घुमावदार, तिरछी और शोर छवियों का समर्थन करता है

किसी फ़ोल्डर या संग्रह में सभी छवियों की बैच पहचान

वेब लिंक के रूप में प्रदान की गई छवियों को पहचानता है

गलत वर्तनी वाले शब्दों को ढूंढता है और स्वचालित रूप से सुधारता है

अन्य Aspose उत्पादों के साथ 100% संगतता

इन्सटाल करना आसान

आप सरल इंस्टॉलेशन निर्देशों का पालन करके सीधे मावेन आधारित प्रोजेक्ट से जावा के लिए Aspose.OCR का उपयोग कर सकते हैं।

बिना किसी सीमा और प्रतिबंध के पूरी तरह कार्यात्मक ओसीआर एप्लिकेशन का निर्माण शुरू करने के लिए एक अस्थायी लाइसेंस का अनुरोध करें।

$Easy to Use$

छवि पहचान के लिए कोड की कुछ पंक्तियों की आवश्यकता होती है। वस्तुत। यह वास्तव में इतना आसान है - स्वयं प्रयास करें:

7 पंक्तियों में पाठ के लिए छवि - जावा

// ओसीआर एपीआई का उदाहरण बनाएं
AsposeOCR api = new AsposeOCR();

try {
    // छवि को पहचानें
    String result = api.RecognizePage(imagePath);
    // मान्यता परिणाम प्रदर्शित करें
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // त्रुटि प्रबंधन
    e.printStackTrace();
}

26 मान्यता भाषाएँ

OCR API मिश्रित भाषाओं वाले टेक्स्ट सहित बड़ी संख्या में भाषाओं और सभी लोकप्रिय लेखन लिपियों का समर्थन करता है। अंतर्निहित वर्तनी परीक्षक स्वचालित रूप से गलत वर्तनी वाले शब्दों को बदल देता है और आपको पहचान परिणामों को मैन्युअल रूप से सही करने की परेशानी से बचाता है।

विस्तारित लैटिन वर्णमाला : क्रोएशियाई, चेक, डेनिश, डच, अंग्रेजी, एस्टोनियाई, फिनिश, फ्रेंच, जर्मन, इतालवी, लातवियाई, लिथुआनियाई, नॉर्वेजियन, पोलिश, पुर्तगाली, रोमानियाई, स्लोवाक, स्लोवेनियाई, स्पेनिश, स्वीडिश।
सिरिलिक वर्णमाला : बेलारूसी, बल्गेरियाई, कज़ाख, रूसी, सर्बियाई, यूक्रेनी।
चीनी : 6,000 से अधिक वर्ण।

आप पहचान प्रदर्शन और विश्वसनीयता बढ़ाने के लिए भाषा निर्दिष्ट कर सकते हैं या एपीआई को स्वचालित रूप से भाषाओं का पता लगाने दे सकते हैं।

स्वरूपण संरक्षित करें

ओसीआर एपीआई सभी लोकप्रिय टाइपफेस जैसे एरियल, टाइम्स न्यू रोमन, कूरियर न्यू, ताहोमा, कैलिब्री और अधिक को नियमित, बोल्ड और इटैलिक शैलियों में पढ़ता है और ओसीआर परिणामों में स्वरूपण को ध्यान से संरक्षित करता है। आप पहचान परिणामों को पंक्तियों में विभाजित कर सकते हैं और किसी पृष्ठ में टेक्स्ट क्षेत्रों का पता लगा सकते हैं।

तस्वीरों को पहचानें

स्कैनर हमेशा अंतिम उपयोगकर्ता वर्कस्टेशन पर उपलब्ध नहीं होता है, जो ओसीआर अनुप्रयोगों के लिए शोस्टॉपर बन सकता है। हमारा OCR API कई प्री-प्रोसेसिंग फ़िल्टर प्रदान करता है जो विकृत, घुमाए गए, तिरछे और शोर वाली छवियों को संभाल सकता है। सभी छवि प्रारूपों के समर्थन के संयोजन में, यह स्मार्टफोन की तस्वीरों की भी विश्वसनीय पहचान की अनुमति देता है। अधिकांश पूर्व-प्रसंस्करण और छवि सुधार स्वचालित रूप से किया जाता है, लेकिन आप हमेशा कठिन मामलों में हस्तक्षेप कर सकते हैं।

छवि सुधार लागू करें - जावा

// ओसीआर एपीआई का उदाहरण बनाएं
AsposeOCR api = new AsposeOCR();

// प्री-प्रोसेसिंग फ़िल्टर को परिभाषित करें
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// मान्यता से पहले पूर्व-प्रक्रिया छवि
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// छवि को पहचानें
RecognitionResult result = api.RecognizePage(imageRes, set);

प्रदर्शन अनुकूलन

ऑप्टिकल कैरेक्टर रिकग्निशन के लिए बहुत सारे प्रोसेसिंग संसाधनों की आवश्यकता होती है, जो वेब सेवाओं और प्रवेश स्तर के उपकरणों के लिए एक समस्या बन सकती है। एपीआई मान्यता गति, संसाधन आवश्यकताओं और सटीकता को संतुलित करने के लिए बहुत ही लचीले तरीके प्रदान करता है:

पूरी तरह से पहचान और तेजी से पहचान के बीच चयन करें।
मान्यता के लिए आवंटित थ्रेड्स की संख्या निर्दिष्ट करें, या लाइब्रेरी को सीपीयू कोर की संख्या को स्वचालित रूप से स्केल करने की अनुमति दें।
गणना को GPU पर लोड करके CPU को मुक्त करें।

तेजी से पहचान - जावा

// ओसीआर एपीआई का उदाहरण बनाएं
AsposeOCR api = new AsposeOCR();

// सबसे तेज़ मोड में छवि को पहचानें
String result = api.RecognizePageFast("sample.jpg");

बैच प्रसंस्करण

OCR API आपको विभिन्न बैच प्रोसेसिंग विधियों की पेशकश करके एक बार में प्रत्येक छवि को पहचानने से मुक्त करता है जो आपको एक ही कॉल में कई छवियों को पहचानने की अनुमति देता है:

बहु-पृष्ठ पीडीएफ और टीआईएफएफ फाइलों की पहचान।
एक संग्रह में सभी फाइलों की पहचान।
एक फ़ोल्डर में सभी फाइलों की पहचान।

Support and Learning Resources

Download Free Trial Pricing Information

Aspose अन्य लोकप्रिय प्रोग्रामिंग भाषाओं के लिए मूल OCR API भी प्रदान करता है:

जावा में छवियों और पीडीएफ को टेक्स्ट में बदलें

ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) क्षमताओं के साथ आसानी से क्रॉस-प्लेटफ़ॉर्म जावा एप्लिकेशन बनाएं।

Aspose.OCR for Java

Overview

एक नजर में

प्लेटफार्म स्वतंत्रता

समर्थित फ़ाइल प्रारूप

जावा के लिए Aspose.OCR की विशेषताएं और क्षमताएं

इन्सटाल करना आसान

$Easy to Use$

7 पंक्तियों में पाठ के लिए छवि - जावा

26 मान्यता भाषाएँ

स्वरूपण संरक्षित करें

तस्वीरों को पहचानें

छवि सुधार लागू करें - जावा

प्रदर्शन अनुकूलन

तेजी से पहचान - जावा

बैच प्रसंस्करण

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forC++