تحويل الصور وملفات PDF إلى نص بجافا
يمكنك إنشاء تطبيقات Java عبر الأنظمة الأساسية بسهولة مع إمكانات التعرف الضوئي على الأحرف (OCR).
Download Free Trialيسمح لك Aspose.OCR for Java باستخراج نص من الصور ولقطات الشاشة ومناطق محددة من الصورة وإنشاء ملفات PDF قابلة للبحث من الملفات الممسوحة ضوئيًا على أي نظام أساسي يدعم Java. من خلال واجهة برمجة التطبيقات القوية وسهلة الاستخدام ، حتى مهام التعرف الضوئي على الحروف المعقدة تستغرق أقل من 10 أسطر من التعليمات البرمجية. لا تحتاج إلى العمل مع الصيغ والتعلم الآلي - ستهتم المكتبة بجميع التفاصيل الفنية وتنتج نتائج موثوقة في 26 لغة بناءً على النصوص اللاتينية والسيريلية ، بالإضافة إلى الصينية . تعالج OCR API الصور الممسوحة ضوئيًا وصور الهاتف الذكي ولقطات الشاشة ومناطق الصور وملفات PDF الممسوحة ضوئيًا وتعيد النتائج بتنسيقات المستندات الأكثر شيوعًا. يمكن تحسين سرعة التعرف والدقة والأداء بشكل أكبر عن طريق توزيع الحوسبة عبر العديد من مراكز وحدة المعالجة المركزية وتفريغ المهام كثيفة الاستخدام للموارد إلى وحدة معالجة الرسومات .
ميزات وقدرات Aspose.OCR لجافا
يتعرف على النص المنسق في الصور الممسوحة ضوئيًا وملفات PDF
يدعم جميع تنسيقات الملفات التي يمكنك الحصول عليها من ماسح ضوئي أو كاميرا
يقرأ النصوص اللاتينية والسيريلية
يتعرف على أكثر من 6000 حرف صيني
يكتشف ويتعرف على جميع المحارف الشائعة
يحافظ بعناية على أنماط الخطوط وتنسيقها
يعالج الصورة بأكملها أو المناطق المحددة فقط
يدعم الصور المستديرة والمنحرفة والصاخبة
التعرف على دفعات لجميع الصور في مجلد أو أرشيف
يتعرف على الصور المقدمة كروابط ويب
البحث عن الكلمات التي بها أخطاء إملائية وتصحيحها تلقائيًا
توافق 100٪ مع منتجات Aspose الأخرى
سهل التنصيب
يمكنك استخدام Aspose.OCR لـ Java مباشرة من مشروع قائم على Maven باتباع تعليمات التثبيت البسيطة.
اطلب ترخيصًا مؤقتًا لبدء إنشاء تطبيق OCR يعمل بكامل طاقته دون أي قيود أو قيود.
$Easy to Use$
يتطلب التعرف على الصور سطرين من التعليمات البرمجية. حرفياً. إنها حقًا بهذه البساطة - جرب نفسك:
صورة للنص في 7 أسطر - جافا
// إنشاء مثيل لـ OCR API
AsposeOCR api = new AsposeOCR();
try {
// التعرف على الصورة
String result = api.RecognizePage(imagePath);
// اعرض نتيجة التعرف
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// معالجة الأخطاء
e.printStackTrace();
}
26 لغات التعرف
تدعم OCR API عددًا كبيرًا من اللغات وجميع نصوص الكتابة الشائعة ، بما في ذلك النصوص ذات اللغات المختلطة. يقوم المدقق الإملائي المدمج تلقائيًا باستبدال الكلمات التي بها أخطاء إملائية ويوفر عليك عناء تصحيح نتائج التعرف يدويًا.
- الأبجدية اللاتينية الممتدة : الكرواتية والتشيكية والدنماركية والهولندية والإنجليزية والإستونية والفنلندية والفرنسية والألمانية والإيطالية واللاتفية والليتوانية والنرويجية والبولندية والبرتغالية والرومانية والسلوفاكية والسلوفينية والإسبانية والسويدية.
- الأبجدية السيريلية : البيلاروسية ، البلغارية ، الكازاخستانية ، الروسية ، الصربية ، الأوكرانية.
- الصينية : أكثر من 6000 حرف.
يمكنك تحديد اللغة لزيادة أداء التعرف والموثوقية أو السماح لواجهة برمجة التطبيقات باكتشاف اللغات تلقائيًا.
الحفاظ على التنسيق
تقرأ واجهة برمجة تطبيقات OCR جميع المحارف الشائعة مثل Arial و Times New Roman و Courier New و Tahoma و Calibri والمزيد بأنماط عادية وجريئة ومائلة وتحافظ بعناية على التنسيق في نتائج OCR. يمكنك أيضًا تقسيم نتائج التعرف إلى أسطر واكتشاف مناطق النص في الصفحة.
التعرف على الصور
لا يتوفر الماسح الضوئي دائمًا في محطات عمل المستخدم النهائي ، والتي قد تصبح أداة عرض لتطبيقات التعرف الضوئي على الحروف. توفر واجهة برمجة تطبيقات OCR الخاصة بنا عددًا من مرشحات المعالجة المسبقة التي يمكنها التعامل مع الصور المشوهة والمستديرة والمنحرفة والصاخبة. بالاقتران مع دعم جميع تنسيقات الصور ، فإنه يسمح بالتعرف الموثوق حتى على صور الهاتف الذكي. تتم معظم عمليات المعالجة المسبقة وتصحيح الصور تلقائيًا ، ولكن يمكنك دائمًا التدخل في الحالات الصعبة.
تطبيق تصحيحات الصورة - Java
// إنشاء مثيل لـ OCR API
AsposeOCR api = new AsposeOCR();
// تحديد مرشحات ما قبل المعالجة
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// قبل معالجة الصورة قبل التعرف عليها
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// التعرف على الصورة
RecognitionResult result = api.RecognizePage(imageRes, set);
تحسين الأداء
يتطلب التعرف البصري على الأحرف الكثير من موارد المعالجة ، والتي قد تصبح مشكلة لخدمات الويب والأجهزة على مستوى الدخول. توفر واجهة برمجة التطبيقات طرقًا مرنة للغاية لتحقيق التوازن بين سرعة التعرف ومتطلبات الموارد والدقة:
- اختر بين التعرف الشامل والتعرف السريع.
- حدد عدد سلاسل الرسائل المخصصة للتعرف عليها ، أو اسمح للمكتبة بالتوسع تلقائيًا في عدد مراكز وحدة المعالجة المركزية.
- قم بتحرير وحدة المعالجة المركزية عن طريق إلغاء تحميل العمليات الحسابية إلى وحدة معالجة الرسومات.
التعرف السريع - جافا
// إنشاء مثيل لـ OCR API
AsposeOCR api = new AsposeOCR();
// التعرف على الصورة في أسرع وضع
String result = api.RecognizePageFast("sample.jpg");
تجهيز الدفعات
تحررك واجهة OCR API من الاضطرار إلى التعرف على كل صورة واحدة في كل مرة من خلال تقديم طرق معالجة مجمعة متنوعة تتيح لك التعرف على صور متعددة في مكالمة واحدة:
- التعرف على ملفات PDF و TIFF متعددة الصفحات.
- التعرف على جميع الملفات في الأرشيف.
- التعرف على جميع الملفات في مجلد.
Support and Learning Resources
- مصادر التعلم
- توثيق
- مصدر الرمز
- مراجع API
- مقاطع فيديو تعليمية
- دعم المنتج
- دعم مجاني
- دعم مدفوع
- مقالات
- ملاحظات الإصدار
- لماذا Aspose.OCR لجافا؟
- قائمة العملاء
- قصص نجاح