تحويل الصور وملفات PDF إلى نص في C ++

أضف التعرف البصري على الأحرف (OCR) إلى تطبيقات C ++ الخاصة بك مع بضعة أسطر من التعليمات البرمجية.

يعمل Aspose.OCR for C ++ على توسيع تطبيقاتك بقدرات التعرف الضوئي على الأحرف في 5 أسطر من التعليمات البرمجية. تمت ترجمة خبرتنا في الشبكات العصبية والتعلم الآلي إلى مكتبة التعرف الضوئي على الحروف بأداء ودقة فائقين تدعم 26 لغة على أساس النصوص اللاتينية والسيريلية وكذلك الصينية . يمكن لـ OCR API التعرف على الصور الممسوحة ضوئيًا وصور الهاتف الذكي ولقطات الشاشة ومناطق الصور وملفات PDF الممسوحة ضوئيًا وإرجاع النتائج في تنسيقات تبادل المستندات والبيانات الأكثر شيوعًا. إنه غير متصل بالإنترنت تمامًا ولا يتطلب اتصالاً بالإنترنت للعمل. تتطلب API الحد الأدنى من الجهد للبدء ومنحنى تعليمي ضحل لإتقانها. يتم تنفيذ جميع عمليات المعالجة المسبقة وتصحيح الانحراف وإزالة الضوضاء واكتشاف اللغة والترابط المتعدد والمهام المعقدة الأخرى تلقائيًا ، ولكن يمكن ضبطها للتعامل مع الحالات الصعبة.

لمحة سريعة

ملخص موجز لقدرات التعرف البصري على الحروف.

الميزات الأساسية

استخراج النص من الصور
قم بإنشاء ملفات PDF قابلة للبحث
تصحيحات تلقائية للصورة
دعم محارف متعددة
الحفاظ على تنسيق النص
كشف أجزاء النص
تجهيز الدفعات
التدقيق الإملائي

اللغات المعتمدة

اللغة الإنجليزية
اللغة الصينية
اللغة الالمانية
اللغة الفرنسية
اللغة الايطالية
اللغة الإسبانية
اللغة الروسية
اللغة التشيكية
اللغة البولندية
اللغة الأوكرانية
لغة هولندية
لغة إستونية
و 10+ أخرى

Aspose.OCR

منصة الاستقلال

تدعم مكتبة OCR بشكل كامل تطبيقات C ++ لكل من Windows و Linux.

Windows 64 bit

Linux 64 bit

Aspose.OCR

تنسيقات الملفات المدعومة

قم بتحويل أي ملف تحصل عليه من ماسح ضوئي أو كاميرا إلى أكثر تنسيقات تبادل البيانات والبيانات شيوعًا.

ملفات المصدر

PDF
JPEG
PNG
TIFF
BMP

نتائج الاعتراف

ملف PDF قابل للبحث فيه
Microsoft Word
Microsoft Excel
نص عادي
JSON
XML

Aspose.OCR

ميزات واجهة برمجة تطبيقات C ++ OCR المتقدمة

يستخرج النص من الصور وينشئ ملفات PDF قابلة للبحث

يدعم أي صورة يمكنك الحصول عليها من ماسح ضوئي أو كاميرا

يقرأ النصوص اللاتينية والسيريلية الموسعة

يتعرف على أكثر من 6000 حرف صيني

يكتشف ويتعرف على جميع المحارف والتنسيقات الشائعة

تعالج الصور قبل التعرف عليها

يعالج الصورة بأكملها أو المناطق المحددة فقط

يدعم الصور المستديرة والمنحرفة والصاخبة

التعرف على دفعات لجميع الصور في مجلد أو أرشيف

يتعرف على الصور المقدمة كروابط ويب

البحث عن الكلمات التي بها أخطاء إملائية وتصحيحها تلقائيًا

الحصول على نتيجة التعرف على شكل JSON

سهل الاستخدام

هل ما زلت تعتقد أن C ++ OCR صعب؟ مع مكتبتنا ، تحتاج فقط إلى 5 أسطر من التعليمات البرمجية للتعرف على الصورة وعرض النتيجة. جرب هذا الرمز وانظر بنفسك:

صورة لنص في 5 أسطر - C ++

// توفير مسار الصورة
std::string image_path = "../Data/Source/sample.png";

// تحضير المخزن المؤقت للنتيجة
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// افعل السحر
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// اعرض نتيجة التعرف
std::wcout << buffer << L"\n";

26 لغات التعرف

يمكن لـ OCR API التعرف على عدد كبير من اللغات وجميع نصوص الكتابة الشائعة ، بما في ذلك النصوص ذات اللغات المختلطة.

الأبجدية اللاتينية الممتدة : الكرواتية والتشيكية والدنماركية والهولندية والإنجليزية والإستونية والفنلندية والفرنسية والألمانية والإيطالية واللاتفية والليتوانية والنرويجية والبولندية والبرتغالية والرومانية والسلوفاكية والسلوفينية والإسبانية والسويدية.
الأبجدية السيريلية : البيلاروسية ، البلغارية ، الكازاخستانية ، الروسية ، الصربية ، الأوكرانية.
الصينية : أكثر من 6000 حرف.

يمكنك ترك اكتشاف اللغة للمكتبة أو تحديد اللغة بنفسك لزيادة أداء التعرف والموثوقية.

تجهيز الدفعات

تحررك OCR API من التعرف على كل صورة واحدة تلو الأخرى من خلال تقديم طرق معالجة مجمعة متنوعة تتيح لك التعرف على صور متعددة في مكالمة واحدة:

التعرف على ملفات PDF و TIFF متعددة الصفحات.
التعرف على جميع الملفات في مجلد.
التعرف على جميع الملفات في الأرشيف.

التعرف على أرشيف ZIP - C ++

// توفير مسار الأرشيف
std::string archive_path = "book.zip";

// تحضير المخزن المؤقت للنتيجة
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// تهيئة كائن RecognitionSettings بالقيم الافتراضية
RecognitionSettings settings;

// تعرف
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

الحفاظ على التنسيق

تقرأ مكتبة OCR جميع المحارف الشائعة مثل Arial و Times New Roman و Courier New و Tahoma و Calibri والمزيد في الأنماط العادية والجريئة والمائلة وتحافظ بعناية على التنسيق في نتائج OCR. يمكنك أيضًا تقسيم نتائج التعرف إلى أسطر واكتشاف مناطق النص في الصفحة.

التعرف على الصور

عادة ما يتوقف اعتماد تطبيقات OCR على نطاق واسع بسبب حقيقة أن الماسحات الضوئية ليست شائعة بالنسبة لمعظم المستخدمين. تحتوي مكتبة OCR الخاصة بنا على مرشحات معالجة مسبقة مدمجة قوية للصور يمكنها التعامل مع الصور المظلمة والمستديرة والمنحرفة والصاخبة. بالاقتران مع دعم جميع تنسيقات الصور ، فإنه يسمح بالتعرف الموثوق حتى على صور الهاتف الذكي. تتم معظم عمليات المعالجة المسبقة وتصحيح الصور تلقائيًا ، لذا لن تضطر إلى التدخل إلا في الحالات الصعبة.

تعيين زاوية مخصصة لتصحيح الانحراف - C ++

// الصورة الأصلية
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// تحضير المخزن المؤقت للنتيجة
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// ضبط زاوية الانحراف
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// التعرف على الصورة
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

التدقيق الإملائي

بينما ينتج عن OCR نتائج موثوقة ، قد تتسبب عيوب الطباعة والغبار في التعرف على بعض الرموز بشكل غير صحيح. تحتوي واجهة OCR API على مدقق إملائي مدمج يستبدل تلقائيًا الكلمات التي بها أخطاء إملائية ويخلصك من الاضطرار إلى تصحيح نتائج التعرف يدويًا.

Support and Learning Resources

لماذا Aspose.OCR لـ C ++؟
قائمة العملاء
قصص نجاح

Download Free Trial Pricing Information

تقدم Aspose أيضًا واجهات برمجة تطبيقات OCR أصلية للغات البرمجة الشائعة الأخرى:

تحويل الصور وملفات PDF إلى نص في C ++

أضف التعرف البصري على الأحرف (OCR) إلى تطبيقات C ++ الخاصة بك مع بضعة أسطر من التعليمات البرمجية.

Aspose.OCR for C++

Overview

لمحة سريعة

منصة الاستقلال

تنسيقات الملفات المدعومة

ميزات واجهة برمجة تطبيقات C ++ OCR المتقدمة

سهل الاستخدام

صورة لنص في 5 أسطر - C ++

26 لغات التعرف

تجهيز الدفعات

التعرف على أرشيف ZIP - C ++

الحفاظ على التنسيق

التعرف على الصور

تعيين زاوية مخصصة لتصحيح الانحراف - C ++

التدقيق الإملائي

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forJava