Aspose.OCR  for C++

تحويل الصور وملفات PDF إلى نص في C ++

أضف التعرف البصري على الأحرف (OCR) إلى تطبيقات C ++ الخاصة بك مع بضعة أسطر من التعليمات البرمجية.

  Download Free Trial
  
 

يعمل Aspose.OCR for C ++ على توسيع تطبيقاتك بقدرات التعرف الضوئي على الأحرف في 5 أسطر من التعليمات البرمجية. تمت ترجمة خبرتنا في الشبكات العصبية والتعلم الآلي إلى مكتبة التعرف الضوئي على الحروف بأداء ودقة فائقين تدعم 26 لغة على أساس النصوص اللاتينية والسيريلية وكذلك الصينية . يمكن لـ OCR API التعرف على الصور الممسوحة ضوئيًا وصور الهاتف الذكي ولقطات الشاشة ومناطق الصور وملفات PDF الممسوحة ضوئيًا وإرجاع النتائج في تنسيقات تبادل المستندات والبيانات الأكثر شيوعًا. إنه غير متصل بالإنترنت تمامًا ولا يتطلب اتصالاً بالإنترنت للعمل. تتطلب API الحد الأدنى من الجهد للبدء ومنحنى تعليمي ضحل لإتقانها. يتم تنفيذ جميع عمليات المعالجة المسبقة وتصحيح الانحراف وإزالة الضوضاء واكتشاف اللغة والترابط المتعدد والمهام المعقدة الأخرى تلقائيًا ، ولكن يمكن ضبطها للتعامل مع الحالات الصعبة.

ميزات واجهة برمجة تطبيقات C ++ OCR المتقدمة

يستخرج النص من الصور وينشئ ملفات PDF قابلة للبحث

يدعم أي صورة يمكنك الحصول عليها من ماسح ضوئي أو كاميرا

يقرأ النصوص اللاتينية والسيريلية الموسعة

يتعرف على أكثر من 6000 حرف صيني

يكتشف ويتعرف على جميع المحارف والتنسيقات الشائعة

تعالج الصور قبل التعرف عليها

يعالج الصورة بأكملها أو المناطق المحددة فقط

يدعم الصور المستديرة والمنحرفة والصاخبة

التعرف على دفعات لجميع الصور في مجلد أو أرشيف

يتعرف على الصور المقدمة كروابط ويب

البحث عن الكلمات التي بها أخطاء إملائية وتصحيحها تلقائيًا

الحصول على نتيجة التعرف على شكل JSON

سهل الاستخدام

هل ما زلت تعتقد أن C ++ OCR صعب؟ مع مكتبتنا ، تحتاج فقط إلى 5 أسطر من التعليمات البرمجية للتعرف على الصورة وعرض النتيجة. جرب هذا الرمز وانظر بنفسك:

صورة لنص في 5 أسطر - C ++

// توفير مسار الصورة
std::string image_path = "../Data/Source/sample.png";

// تحضير المخزن المؤقت للنتيجة
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// افعل السحر
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// اعرض نتيجة التعرف
std::wcout << buffer << L"\n";

26 لغات التعرف

يمكن لـ OCR API التعرف على عدد كبير من اللغات وجميع نصوص الكتابة الشائعة ، بما في ذلك النصوص ذات اللغات المختلطة.

  • الأبجدية اللاتينية الممتدة : الكرواتية والتشيكية والدنماركية والهولندية والإنجليزية والإستونية والفنلندية والفرنسية والألمانية والإيطالية واللاتفية والليتوانية والنرويجية والبولندية والبرتغالية والرومانية والسلوفاكية والسلوفينية والإسبانية والسويدية.
  • الأبجدية السيريلية : البيلاروسية ، البلغارية ، الكازاخستانية ، الروسية ، الصربية ، الأوكرانية.
  • الصينية : أكثر من 6000 حرف.

يمكنك ترك اكتشاف اللغة للمكتبة أو تحديد اللغة بنفسك لزيادة أداء التعرف والموثوقية.

تجهيز الدفعات

تحررك OCR API من التعرف على كل صورة واحدة تلو الأخرى من خلال تقديم طرق معالجة مجمعة متنوعة تتيح لك التعرف على صور متعددة في مكالمة واحدة:

  • التعرف على ملفات PDF و TIFF متعددة الصفحات.
  • التعرف على جميع الملفات في مجلد.
  • التعرف على جميع الملفات في الأرشيف.

التعرف على أرشيف ZIP - C ++

// توفير مسار الأرشيف
std::string archive_path = "book.zip";

// تحضير المخزن المؤقت للنتيجة
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// تهيئة كائن RecognitionSettings بالقيم الافتراضية
RecognitionSettings settings;

// تعرف
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

الحفاظ على التنسيق

تقرأ مكتبة OCR جميع المحارف الشائعة مثل Arial و Times New Roman و Courier New و Tahoma و Calibri والمزيد في الأنماط العادية والجريئة والمائلة وتحافظ بعناية على التنسيق في نتائج OCR. يمكنك أيضًا تقسيم نتائج التعرف إلى أسطر واكتشاف مناطق النص في الصفحة.

التعرف على الصور

عادة ما يتوقف اعتماد تطبيقات OCR على نطاق واسع بسبب حقيقة أن الماسحات الضوئية ليست شائعة بالنسبة لمعظم المستخدمين. تحتوي مكتبة OCR الخاصة بنا على مرشحات معالجة مسبقة مدمجة قوية للصور يمكنها التعامل مع الصور المظلمة والمستديرة والمنحرفة والصاخبة. بالاقتران مع دعم جميع تنسيقات الصور ، فإنه يسمح بالتعرف الموثوق حتى على صور الهاتف الذكي. تتم معظم عمليات المعالجة المسبقة وتصحيح الصور تلقائيًا ، لذا لن تضطر إلى التدخل إلا في الحالات الصعبة.

تعيين زاوية مخصصة لتصحيح الانحراف - C ++

// الصورة الأصلية
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// تحضير المخزن المؤقت للنتيجة
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// ضبط زاوية الانحراف
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// التعرف على الصورة
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

التدقيق الإملائي

بينما ينتج عن OCR نتائج موثوقة ، قد تتسبب عيوب الطباعة والغبار في التعرف على بعض الرموز بشكل غير صحيح. تحتوي واجهة OCR API على مدقق إملائي مدمج يستبدل تلقائيًا الكلمات التي بها أخطاء إملائية ويخلصك من الاضطرار إلى تصحيح نتائج التعرف يدويًا.

  
  

تقدم Aspose أيضًا واجهات برمجة تطبيقات OCR أصلية للغات البرمجة الشائعة الأخرى: