لماذا تختار مكتبة Aspose OCR؟

قم ببناء قدرات التعرف الضوئي على الحروف (OCR) القوية في تطبيقات .NET الخاصة بك في ثوانٍ. تتيح لك واجهة OCR API سهلة الاستخدام استخراج النص من الصور وعمليات المسح وإنشاء ملفات PDF قابلة للبحث والمزيد باستخدام الحد الأدنى من كود C#. مثالية لوظائف .NET لسطح المكتب والويب والسحابة والوظائف التي لا تحتوي على خادم. انقر فوق العناصر أدناه لمعرفة المزيد حول ميزاتنا وفوائدنا.

Illustration ocr

تطبيقات التعرف الضوئي على الحروف العالمية

يتعرف C# OCR على النصوص الإنجليزية والسيريلية والعربية والفارسية والصينية واليابانية والكورية والهندية والتاميلية والنصوص المختلطة اللغات.

اقرأ كل شيء

احصل على نص من أي ملف تم الحصول عليه من خلال الماسح الضوئي أو الكاميرا، وقم بمعالجة الصور مباشرة من روابط الويب.

نتائج موثوقة

تحقيق دقة التعرف العالية على جميع الصور، بما في ذلك الصور التي تكون خارج نطاق التركيز، والمدورة، والمشوهة، والمزعجة.

التعرف على الدفعة

التعرف على جميع الصور من المجلدات والأرشيفات بشكل مجمّع؛ قراءة مستندات PDF متعددة الصفحات وصور TIFF.

كشف التخطيط

تحديد وتصنيف كتل المحتوى في الصور لضمان الترتيب الصحيح للنص المستخرج، بغض النظر عن التخطيط.

عينة التعليمات البرمجية الحية

تصبح .NET OCR مهمة تافهة ومباشرة مع Aspose OCR API، حتى بالنسبة للمطورين الجدد. تكفي بضعة أسطر من التعليمات البرمجية لاستخراج نص من الصورة وعرضه على الشاشة. الأمر بهذه البساطة حقًا - جربه.

على استعداد للاعتراف على استعداد للاعتراف قم بإسقاط ملف هنا أو انقر للتصفح *

* عن طريق تحميل ملفاتك أو استخدام الخدمة فإنك توافق على ذلك شروط الاستخدام و سياسة الخصوصية.

نتيجة الاعتراف
 

تحويل الصورة إلى نص

المزيد من الأمثلة >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

استقلالية المنصة

يمكن لمكتبة التعرف الضوئي على الحروف عبر الأنظمة الأساسية أن تعمل في كل مكان ضمن .NET أو .NET Core أو .NET Framework - سواء على جهاز محلي أو على خادم الويب، أو في السحابة.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

تنسيقات الملفات المدعومة

Aspose.OCR for .NET يمكن أن تعمل مع أي ملف يمكنك الحصول عليها من الماسح الضوئي أو الكاميرا. يمكن حفظ نتائج التعرف أو استيرادها إلى قاعدة بيانات أو تحليلها في الوقت الفعلي.

الصور

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

دفعة التعرف الضوئي على الحروف

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

نتائج الاعتراف

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

مناسبة لأي محتوى

تعتمد دقة وموثوقية التعرف على النص في C# إلى حد كبير على جودة الصورة. يقدم .NET OCR مجموعة كاملة من تحسينات الصور الآلية واليدوية، مما يضمن نتائج التعرف الفائقة.

تعمل المعالجة القوية للصور والكشف عن النص القابل للتخصيص بالكامل والمعالجة اللاحقة والتصحيح الإملائي الآلي على تمكين استخراج النص من أي مسح ضوئي أو صورة بأعلى دقة.

تحسين موارد التعرف الضوئي على الحروف

تتيح مكتبة Aspose’ C# OCR موازنة مرنة للغاية لسرعة التعرف والجودة واستخدام الموارد لكل حالة استخدام محددة:

  • اختر بين التعرف الشامل والتعرف السريع.
  • حدد عدد سلاسل العمليات المخصصة للتعرف عليها، أو اسمح لمكتبة .NET OCR الخاصة بنا بالتكيف تلقائيًا مع عدد نوى المعالج.
  • قم بتحرير وحدة المعالجة المركزية (CPU) عن طريق تفريغ العمليات الحسابية إلى وحدة معالجة الرسومات (GPU).

أكثر من 140 لغة التعرف

تعد مكتبة C# OCR الخاصة بنا حلاً عالميًا لمعالجة المستندات واستخراج البيانات ورقمنة المحتوى على نطاق عالمي. ومع دعمه لمجموعة واسعة من نصوص الكتابة الأوروبية والشرق أوسطية والآسيوية، فهو ملائم تمامًا لأي بلد أو شركة.

يمكنك التعرف على المستندات المكتوبة بلغات مختلطة، مثل الصينية/الإنجليزية، أو العربية/الفرنسية، أو السيريلية/الإنجليزية. اللغات التالية مدعومة:

  • اللاتينية الموسعة: الإنجليزية، الإسبانية، الفرنسية، الإندونيسية، البرتغالية، الألمانية، الفيتنامية، التركية، الإيطالية، البولندية، وأكثر من 80 لغة أخرى؛
  • الأبجدية السيريلية: الروسية والأوكرانية والكازاخستانية والبلغارية، بما في ذلك النصوص السيريلية/الإنجليزية المختلطة؛
  • العربية، الفارسية، الأردية، بما في ذلك النصوص الممزوجة بالإنجليزية؛
  • اللغات الصينية والكورية واليابانية والديفاناغارية والدرافيديونية، بما في ذلك الهندية والتاميلية والماراثية وغيرها.

الميزات والقدرات

يقوم C# OCR باستخراج النص تلقائيًا من الصور أو المسح الضوئي، مما يلغي الحاجة إلى إعادة كتابة المستندات يدويًا.

Feature icon

التعرف الضوئي على الحروف للصور

استخرج النص من صور الهاتف الذكي بدقة مستوى المسح الضوئي.

Feature icon

PDF قابل للبحث

قم بتحويل أي مسح ضوئي إلى مستند قابل للبحث والفهرسة بشكل كامل.

Feature icon

التعرف على عنوان URL

التعرف على الصورة من URL دون تنزيلها محليًا.

Feature icon

الاعتراف بالجملة

اقرأ جميع الصور من المستندات والمجلدات والأرشيفات متعددة الصفحات.

Feature icon

أي الخط والأسلوب

التعرف على النص والتعرف عليه في جميع الخطوط والأنماط الشائعة.

Feature icon

التعرف الدقيق

اضبط كل معلمة OCR للحصول على أفضل نتائج التعرف.

Feature icon

المدقق الإملائي

تحسين النتائج عن طريق تصحيح الكلمات التي بها أخطاء إملائية تلقائيًا.

Feature icon

البحث عن النص في الصور

ابحث عن نص أو تعبير عادي ضمن مجموعة من الصور.

Feature icon

مقارنة النصوص الصورة

مقارنة النصوص على صورتين، بغض النظر عن الحالة والتخطيط.

سهل الاستخدام للتعرف الضوئي على الحروف

باستخدام واجهة برمجة تطبيقات C# OCR الخاصة بنا، تحتاج فقط إلى بضعة أسطر من كود C# لتحويل الصورة إلى نص، وإنشاء ملف PDF قابل للبحث، وحفظ نتائج التعرف في مستند، وغير ذلك الكثير. استكشف نماذج التعليمات البرمجية لفهم كيفية دمج OCR API في حلول .NET الخاصة بك.

تثبيت

يتم توزيع .NET OCR على هيئة حزمة NuGet أو على هيئة [ملف قابل للتنزيل]( https://releases.aspose.com/ocr/net /) مع الحد الأدنى من التبعيات. يمكن إضافة الحزمة إلى مشروعك مباشرة من Microsoft Visual Studio. ما عليك سوى تثبيته على مشروعك وستكون جاهزًا لاستخراج النص من الصور وحفظ نتائج التعرف بأي من التنسيقات المدعومة. إذا كان نظامك يحتوي على وحدة معالجة رسومات قادرة على استخدام CUDA، فيمكنك استخدام محرك التعرف الضوئي على الحروف المسرع بواسطة GPU لزيادة أداء التعرف بشكل ملحوظ.

يمكنك البدء في استخدام Aspose OCR لـ .NET مباشرة بعد التثبيت مع بعض القيود . يزيل الترخيص المؤقت جميع قيود الإصدار التجريبي لمدة 30 يومًا. استخدمه لبدء إنشاء تطبيق OCR كامل الوظائف واتخاذ القرار النهائي بشراء OCR لـ .NET لاحقًا.

استخراج النص من الصورة

عندما يفكر الناس عادة في التعرف الضوئي على الحروف (OCR)، فإن الارتباط الأول غالبًا ما يكون مع الماسح الضوئي باعتباره جهاز الالتقاط الأساسي. ولهذا الارتباط أسباب تاريخية ولا يزال سائدًا في العديد من السياقات، مما يوفر بيئة متسقة وخاضعة للرقابة لالتقاط النص المطبوع من المستندات المادية بجودة لا مثيل لها. ومع ذلك، فإن الماسح الضوئي عبارة عن معدات متخصصة لا تكون في متناول اليد دائمًا وتتطلب محطة عمل ثابتة لتشغيلها. لحسن الحظ، يوفر العالم الحديث بديلا مناسبا للماسحات الضوئية التقليدية - كاميرا الهاتف الذكي. تضمن التطورات في تكنولوجيا كاميرا الهاتف الذكي أنه حتى الهاتف الذكي ذو المستوى المبتدئ يوفر جودة كافية لالتقاط المستندات الجاهزة للتعرف الضوئي على الحروف. وتسهل الذاكرة المدمجة تحويل كميات كبيرة من المستندات والصحف والكتب ولافتات الشوارع والنصوص الأخرى إلى صيغة رقمية بسهولة أكبر من أي وقت مضى. كل ما تحتاجه هو التكنولوجيا المناسبة لتحويل تلك الصور إلى نص يمكن قراءته آليًا.

تم تصميم مكتبة C# OCR الخاصة بنا خصيصًا للتعرف على جميع أنواع الصور الجاهزة ويمكن ضبطها بشكل أكبر للتعامل حتى مع الصور منخفضة الجودة. ومع هاتف ذكي حديث، فإنه يسمح لك بإنشاء تطبيقات التعرف الضوئي على الحروف (OCR) القوية لمعظم مهام المسح الضوئي اليومية والتعرف على النص. يتم إجراء معالجة الصور الأكثر تقدمًا وتحليل بنية المستندات في بضعة أسطر من التعليمات البرمجية، مما يسمح لك بالتركيز على الأعمال بدلاً من الخوارزميات الرياضية المعقدة والشبكات العصبية والتعقيدات التقنية الأخرى.

التعرف الضوئي على الحروف للصور - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

قم بإنشاء ملف PDF قابل للبحث من خلال المسح الضوئي

يعد PDF أحد التنسيقات الأكثر شيوعًا لمسح المستندات الورقية ضوئيًا، خاصة نظرًا لقدرته على دمج صفحات متعددة في ملف واحد. يُستخدم هذا التنسيق على نطاق واسع لتبادل العقود والفواتير والمستندات القانونية وجوازات السفر وبطاقات الهوية والعديد من المستندات الأخرى بين الأفراد والشركات والبنوك والهيئات الحكومية. ومع ذلك، فإن أي ملف PDF ممسوح ضوئيًا هو في الأساس مجموعة من الصور. ولا يحتوي على نص يمكن قراءته آليًا، لذا لا يمكن للمستخدمين البحث في محتوى المستند أو نسخه أو التعامل معه بأي طريقة أخرى.

يوفر لك Aspose .NET OCR طريقة سريعة وسهلة وموثوقة للغاية لتحويل أي ملف PDF ممسوح ضوئيًا إلى مستند قابل للبحث والفهرسة بشكل كامل. فهو يتعرف بدقة على محتوى الصفحة، ويحوله إلى طبقة نصية يمكن قراءتها آليًا فوق الصورة الأصلية التي يمكن تحديدها ونسخها وقراءتها بواسطة برنامج تحويل النص إلى كلام، وحتى معالجتها تلقائيًا بواسطة المترجمين والملخصين وغيرهم من التحليلات التي تدعم الذكاء الاصطناعي أدوات.

إضافة تراكب النص إلى PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

البحث عن النص في الصور

غالبًا ما تتكون الأرشيفات الرقمية، خاصة في المؤسسات الكبيرة، من مجموعة كبيرة من عمليات المسح والصور، وقد يحتوي الكثير منها على مستندات متعددة الصفحات. إن الإدارة والتنظيم الفعالين لمثل هذه المحفوظات بشكل فعال أمر ضروري لسهولة استرجاع المعلومات والتنقل فيها. ومع ذلك، لا تحتوي الصور على نص يمكن قراءته آليًا، مما يجعل من المستحيل البحث عن محتوى المستند وتحليله.

تتيح لك مكتبة C# OCR البحث بسهولة عن النص في الصور، بغض النظر عن الخط وحجم النص والنمط والمعلمات الأخرى. تدعم المكتبة أيضًا عمليات البحث غير الحساسة لحالة الأحرف والتعبيرات العادية، والتي تكون مفيدة للغاية في مختلف التطبيقات والصناعات. يمكن استخدام هذه الوظيفة لتصنيف المستندات بناءً على المحتوى أو الكلمات الرئيسية أو الأنماط الموجودة في النص؛ البحث عن مصطلحات أو بنود محددة ضمن الاتفاقيات والعقود؛ إعادة تنظيم الملفات بناءً على الكلمات الرئيسية أو المحتوى الموجود بداخلها؛ تحديد موقع البيانات الشخصية وتحديدها داخل المستندات، مما يسهل ضمان الامتثال للقانون العام لحماية البيانات وإدارة المعلومات الحساسة بشكل أكثر فعالية. يتيح البحث بالصور أيضًا إنشاء سير عمل آلي وتبسيط العمليات التجارية المختلفة عند استلام العقود والفواتير الموقعة.

البحث عن نص في الصور - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}