لماذا تختار مكتبة OCR؟

قم ببناء إمكانيات OCR قوية في تطبيقات .NET الخاصة بك في ثوان. يتيح لك واجهة برمجة تطبيقات OCR سهلة الاستخدام استخراج النص من الصور والمسح ، وإنشاء ملفات PDF القابلة للبحث ، وأكثر مع كود C# الحد الأدنى. مثالي لسطح المكتب .NET ، ويب ، وسحابة ، وأدوات الخادم.
جرب التعرف الضوئي التعريفي الذي لا يستخرج النص فقط ، ولكنه يفهمه ويعززه مع الذكاء الاصطناعي. انقر على العناصر أدناه لمعرفة المزيد عن ميزاتنا وفوائدنا.

Illustration ocr

تطبيقات OCR العالمية

يعترف C# OCR باللغة الإنجليزية ، السيريلية ، العربية ، الفارسية ، الصينية ، اليابانية ، الكورية ، الهندية ، التاميل ، والنصوص المختلطة باللغة.

اقرأ كل شيء

احصل على نص من أي ملف تم الحصول عليه من خلال ماسح ضوئي أو كاميرا ، ومعالجة الصور مباشرة من روابط الويب.

نتائج موثوقة

تحقيق دقة الاعتراف العالي لجميع الصور ، بما في ذلك تلك التي يتم التركيز عليها ، وتناوب ، مشوهة ، وصاخبة.

التعرف على الدفعة

يعاني من التعرف على جميع الصور من المجلدات والمحفوظات ؛ قراءة وثائق PDF متعددة الصفحات وصور TIFF.

الكشف عن التصميم

تحديد وتصنيف كتل المحتوى في الصور لضمان الترتيب الصحيح للنص المستخرج ، بغض النظر عن التصميم.

AI Postprocessing باستخدام LLMS

ليس فقط OCR-حل AI الخاص بك الكل في واحد للتعرف على النص الأكثر ذكاءً وخالية من الأخطاء. ASPOSE.OCR الآن يدمج AI و LLMS لاختيار النماذج التي تعزز بشكل كبير دقة التعرف الضوئي على الحروف - مع تربية الأخطاء ، واستعادة النص المفقود ، وتحسين جودة التعرف بشكل عام.

عينة الكود المباشر

.NET OCR تصبح مهمة تافهة ومباشرة مع AS -OVE OCR API ، حتى للمطورين الجدد. فقط بضعة أسطر من التعليمات البرمجية كافية لاستخراج النص من صورة وعرضه على الشاشة. إنه أمر بسيط حقًا - جربه.

على استعداد للاعتراف على استعداد للاعتراف إسقاط ملف هنا أو انقر لتصفح *

* عن طريق تحميل ملفاتك أو استخدام الخدمة التي توافق عليها شروط الاستخدام و سياسة الخصوصية.

نتيجة الاعتراف
 

تحويل الصورة إلى نص

المزيد من الأمثلة >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

استقلال المنصة

يمكن أن تعمل مكتبة OCR عبر المنصات في كل مكان تحت .NET أو .NET Core أو .NET Framework-سواء على جهاز محلي أو على خادم الويب أو السحابة.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

تنسيقات الملف المدعومة

Aspose.OCR for .NET يمكن أن تعمل مع أي ملف يمكنك الحصول على الماسح الضوئي أو الكاميرا. يمكن حفظ نتائج الاعتراف أو استيرادها إلى قاعدة بيانات أو تحليلها في الوقت الفعلي.

الصور

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

دفعة OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

نتائج التعرف

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

LLM مدعوم من OCR: الجيل القادم من OCR مدفوعة بنماذج لغة الذكاء الاصطناعى.

لا تتوقف دقة النتيجة عند التعرف - فتح المستوى التالي من الجودة عن طريق تحسين النص باستخدام LLMs الخارجية.

  • تلقائيا تصحيح الإملاء والقواعد في النص المعترف به.
  • تطبيع التناقضات وقضايا التنسيق عبر عمليات مسح متعددة الصفحات.
  • تكيف نتائج التعرف على المفردات الخاصة بالموضوع باستخدام نماذج تعتمد على المطالبة.
  • دمج أي خط أنابيب LLM خارجي في سير عمل OCR الخاص بك مع بضعة أسطر من التعليمات البرمجية.

مناسب لأي محتوى

تعتمد دقة وموثوقية التعرف على النص في C# إلى حد كبير على جودة الصورة. يوفر .NET OCR مجموعة كاملة من تحسين الصور الآلي واليدوي ، مما يضمن نتائج التعرف المتفوقة.

تتيح معالجة الصور القوية ، والكشف عن النص القابل للتخصيص بالكامل ، وتصحيح ما بعد المعالجة ، وتصحيح الإملاء الآلي استخراج النص من أي فحص أو صورة بأعلى دقة.

تحسين الموارد OCR

تتيح مكتبة Aspose ‘C# OCR موازنة مرنة للغاية لسرعة الاعتراف والجودة واستخدام الموارد لكل حالة استخدام محددة:

  • اختر بين الاعتراف الشامل والاعتراف السريع.
  • حدد عدد مؤشرات الترابط المخصصة للاعتراف ، أو السماح لمكتبة .NET OCR الخاصة بنا بالتوسيع تلقائيًا إلى عدد النوى المعالج.
  • تحرير وحدة المعالجة المركزية عن طريق تفريغ الحسابات إلى وحدة معالجة الرسومات.

140+ لغات التعرف

تعد مكتبة C# OCR الخاصة بنا حلًا عالميًا لمعالجة المستندات واستخراج البيانات ورقمنة المحتوى على نطاق عالمي. بدعم من مجموعة واسعة من البرامج النصية للكتابة الأوروبية والشرقية والآسيوية ، يتم تكييفها جيدًا لأي بلد وأعمال تجارية.

يمكنك التعرف على المستندات المكتوبة بلغات مختلطة ، مثل اللغة الصينية/الإنجليزية أو العربية/الفرنسية أو السيريلية/الإنجليزية. اللغات التالية مدعومة:

  • ** الممتد اللاتيني **: الإنجليزية والإسبانية والفرنسية والإندونيسية والبرتغالية والألمانية والفيتنامية والتركية والإيطالية والبولندية و 80+ أخرى ؛
  • ** السيريليك ** الأبجدية: الروسية ، الأوكرانية ، كازاخاخية ، البلغارية ، بما في ذلك النصوص السيريلية/الإنجليزية المختلطة ؛
  • اللغة العربية ، الفارسية ، الأردية ، بما في ذلك النصوص المخلوطة باللغة الإنجليزية ؛
  • اللغات الصينية والكورية واليابانية وديفاناجاري ودرافيديان ، بما في ذلك الهندية والتاميل والماراثى وغيرها.

الميزات والقدرات

يقوم C# OCR تلقائيًا باستخراج النص من الصور أو عمليات المسح ، مما يلغي الحاجة إلى إعادة تربية المستندات اليدوية.

Feature icon

الصورة OCR

استخراج النص من صور الهاتف الذكي بدقة مستوى المسح.

Feature icon

PDF قابل للبحث

تحويل أي فحص إلى مستند قابل للبحث بالكامل وقابل للفهرسة.

Feature icon

التعرف على عنوان URL

تعرف على صورة من عنوان URL دون تنزيلها محليًا.

Feature icon

الاعتراف بالجملة

اقرأ جميع الصور من المستندات والمجلدات والأرشيفات متعددة الصفحات.

Feature icon

أي خط وأسلوب

تحديد النص والتعرف عليه في جميع المحارف والأنماط الشائعة.

Feature icon

الاعتراف بالضبط

اضبط كل معلمة OCR للحصول على أفضل نتائج التعرف.

Feature icon

المدقق الإملائي

تحسين النتائج عن طريق تصحيح الكلمات الإملائية تلقائيًا.

Feature icon

ابحث عن نص في الصور

ابحث عن النص أو التعبير العادي داخل مجموعة من الصور.

Feature icon

قارن نصوص الصور

قارن النصوص على صورتين ، بغض النظر عن الحالة والتخطيط.

Feature icon

تصحيح الذكاء الذكاء

إصلاح الكلمات غير المعروفة والقواعد باستخدام LLMs المستندة إلى المحولات-لا يوجد تدريب مخصص مطلوب.

Feature icon

دلالات ما بعد المعالجة

تجاوز الشخصيات: صقل إخراج OCR صاخب مع LLMS لتحسين جودة المحتوى وتطبيع اللغة.

Feature icon

خطوط أنابيب LLM المكانية

قم بتوصيل نماذج اللغة الخارجية لتصحيح أخطاء التعرف على المعرفة التعريفي واستعادة نص غير مكتمل أو مجزأ.

سهل الاستخدام OCR

من خلال واجهة برمجة تطبيقات C# OCR ، تحتاج فقط إلى بضعة أسطر من رمز C# لتحويل الصورة إلى نص ، وإنشاء ملف PDF قابل للبحث ، وحفظ نتائج التعرف على المستند ، وغيرها الكثير. استكشف عينات الكود لفهم كيفية دمج واجهة برمجة تطبيقات OCR في حلول .NET الخاصة بك.

تثبيت

.NET OCR يتم توزيعها على أنها حزمة nuget أو كـ ملف قابل للتنزيل مع الحد الأدنى من التبعيات. يمكن إضافة الحزمة إلى مشروعك مباشرة من Microsoft Visual Studio. ما عليك سوى تثبيته على مشروعك وأنت مستعد لاستخراج النص من الصور وحفظ نتائج التعرف في أي من التنسيقات المدعومة. إذا كان نظامك يحتوي على وحدة معالجة الرسومات CUDA قادرة ، فيمكنك استخدام GPU-Accelerated OCR Engine لزيادة أداء التعرف بشكل كبير.

يمكنك البدء في استخدام AS -OCR لـ .NET مباشرة بعد التثبيت مع بعض القيود . يزيل الترخيص المؤقت جميع قيود النسخة التجريبية لمدة 30 يومًا. استخدمه لبدء بناء تطبيق OCR يعمل بكامل طاقته واتخاذ القرار النهائي لشراء OCR لـ .NET لاحقًا.

استخراج النص من صورة

عندما يفكر الأشخاص عادةً في التعرف على الحروف الضوئية (التعرف على الأحرف البصرية) ، يكون الارتباط الأول غالبًا مع ماسح ضوئي كجهاز التقاط الأساسي. هذه الرابطة لها أسباب تاريخية ولا تزال سائدة في العديد من السياقات ، مما يوفر بيئة متسقة ومكافحة لالتقاط النص المطبوع من المستندات المادية بجودة لا مثيل لها. ومع ذلك ، فإن الماسح الضوئي عبارة عن معدات متخصصة لا تكون دائمًا في متناول اليد وتتطلب محطة عمل ثابتة للعمل. لحسن الحظ ، يوفر العالم الحديث بديلاً مناسبًا للماسحات الضوئية التقليدية - كاميرا هاتف ذكي. تضمن التطورات في تقنية كاميرا الهواتف الذكية أنه حتى الهاتف الذكي للمبتدئين يوفر جودة كافية لالتقاط مستندات جاهزة للوسوف التعريفي. والذاكرة المدمجة تجعل من الأسهل من أي وقت مضى رقمنة كميات كبيرة من المستندات والصحف والكتب وعلامات الشوارع والنصوص الأخرى أثناء التنقل. كل ما تحتاجه هو التكنولوجيا المناسبة لتحويل تلك الصور إلى نص قابل للقراءة الآلي.

تم تصميم مكتبة C# OCR الخاصة بنا خصيصًا للتعرف على جميع أنواع الصور خارج الصندوق ويمكن ضبطها بشكل أكبر للتعامل مع الصور ذات الجودة المنخفضة. إلى جانب هاتف ذكي حديث ، يتيح لك إنشاء تطبيقات OCR قوية لمعظم مهام المسح اليومية والتعرف على النصوص. يتم إجراء تحليل الصور الأكثر تقدماً وتحليل بنية المستندات في بضع أسطر من التعليمات البرمجية ، مما يتيح لك التركيز على الأعمال التجارية بدلاً من الخوارزميات الرياضية المعقدة والشبكات العصبية وغيرها من التعقيدات الفنية.

الصورة OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

قم بإنشاء ملف PDF قابل للبحث من الفحص

تعد PDF واحدة من أكثر التنسيقات شعبية لمسح المستندات الورقية ، خاصةً بسبب قدرتها على الجمع بين صفحات متعددة في ملف واحد. يستخدم هذا التنسيق على نطاق واسع لتبادل العقود والفواتير والوثائق القانونية وجوازات السفر وبطاقات الهوية والعديد من المستندات الأخرى بين الأفراد والشركات والبنوك والوكالات الحكومية. ومع ذلك ، فإن أي PDF الممسوحة ضوئيا هو في الأساس مجموعة من الصور. لا يحتوي على نص قابل للقراءة للآلة ، بحيث لا يمكن للمستخدمين البحث أو نسخ أو معالجة محتوى المستند.

aspose .NET OCR يوفر لك طريقة سريعة وسهلة وموثوقة للغاية لتحويل أي ملفات PDF ممسوحة ضوئيًا إلى مستند قابل للبحث بالكامل. إنه يتعرف بدقة على محتوى الصفحة ، وتحويله إلى طبقة نصية قابلة للقراءة عبر الجهاز عبر الصورة الأصلية التي يمكن تحديدها ، ونسخها ، وقراءتها بواسطة برنامج النص إلى كلام ، وحتى تلقائيًا معالجتها من قبل المترجمين والمباريات وأدوات التحليلات الأخرى التي تعمل بالنيابة.

أضف تراكب النص إلى PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

ابحث عن النص في الصور

غالبًا ما تتكون المحفوظات الرقمية ، وخاصة في المنظمات الكبيرة ، من مجموعة واسعة من عمليات الفحص والصور ، والتي قد تحتوي العديد منها على مستندات متعددة الصفحات. تعد الإدارة والتنظيم الفعال لمثل هذه المحفوظات ضرورية لاسترجاع المعلومات السهل والملاحة. ومع ذلك ، لا تحتوي الصور على نص قابل للقراءة الآلي ، مما يجعل من المستحيل البحث وتحليل محتوى المستند.

تتيح لك مكتبة C# OCR البحث بسهولة عن النص في الصور ، بغض النظر عن الخط ، وحجم النص ، والأناقة ، وغيرها من المعلمات. تدعم المكتبة أيضًا عمليات البحث غير الحساسة للحالة والتعبيرات العادية ، والتي تكون مفيدة للغاية في مختلف التطبيقات والصناعات. يمكن استخدام هذه الوظيفة لتصنيف المستندات بناءً على المحتوى أو الكلمات الرئيسية أو الأنماط الموجودة في النص ؛ البحث عن شروط أو جمل محددة ضمن الاتفاقات والعقود ؛ إعادة تنظيم الملفات بناءً على الكلمات الرئيسية أو المحتوى الموجود داخلها ؛ حدد موقع البيانات الشخصية وتحديدها داخل المستندات ، مما يسهل ضمان امتثال الناتج المحلي الإجمالي وإدارة المعلومات الحساسة بشكل أكثر فعالية. يتيح البحث مع الصور أيضًا إنشاء سير عمل آلي وتبسيط عمليات الأعمال المختلفة عند تلقي عقود وفواتير موقعة.

ابحث عن النص في الصور - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

AI Postprocessing مع LLM

يمكنك الآن تجاوز الاعتراف الخام وتطبيق المنطق الذي يحركه AI لتحسين الجودة النصية لنتائج التعرف الضوئي على الحروف. يمكن أن تصحح نماذج اللغة الكبيرة (LLMS) أخطاء الإملاء بذكاء ، واستعادة حدود الكلمات ، وتطبيق قواعد القواعد ، وتكييف النص بناءً على السياق-وهو أمر لا يمكن أن يفعله أرقام الإملائية المستندة إلى بناء الجملة.

خطوة ما بعد المعالجة هذه مثالية للمسح ذو الجودة المنخفضة أو الصور ذات ضوضاء الخلفية أو المستندات متعددة اللغات. يمكنك توصيل أي خط أنابيب LLM يدعم إدخال/إخراج النص الأساسي ، أو استخدام أدوات التصحيح الذكية المدمجة في ASPOST للحصول على نتائج جاهزة للإنتاج.

🧠ai postprocessing مع LLM - C#

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();