چرا کتابخانه OCR را انتخاب کنید؟

در چند ثانیه قابلیت های قدرتمند OCR را در برنامه های دات نت خود ایجاد کنید. API آسان برای استفاده ما به شما امکان می دهد متن را از تصاویر و اسکن ها استخراج کنید ، PDF های قابل جستجو و موارد دیگر را با حداقل کد C# ایجاد کنید. ایده آل برای دسک تاپ .NET ، وب ، ابر و توابع بدون سرور.
OCR را تجربه کنید که فقط متن را استخراج نمی کند ، بلکه آن را با هوش مصنوعی درک و تقویت می کند. برای کسب اطلاعات بیشتر در مورد ویژگی ها و مزایای ما ، روی موارد زیر کلیک کنید.

Illustration ocr

برنامه های جهانی OCR

C# OCR متون انگلیسی ، سیریلیک ، عربی ، فارسی ، چینی ، ژاپنی ، کره ای ، هندی ، تامیل و مختلط را به رسمیت می شناسد.

همه چیز را بخوانید

از هر پرونده ای که از طریق یک اسکنر یا دوربین به دست آمده ، متن را دریافت کنید و تصاویر را مستقیماً از لینک های وب پردازش کنید.

نتایج قابل اعتماد

به دقت شناخت بالا برای همه تصاویر ، از جمله آنهایی که خارج از فوکوس ، چرخان ، تحریف شده و پر سر و صدا هستند ، دست یابید.

شناخت دسته

همه تصاویر را از پوشه ها و بایگانی ها به رسمیت شناخت. اسناد PDF چند صفحه ای و تصاویر TIFF را بخوانید.

تشخیص طرح

بدون در نظر گرفتن طرح ، بلوک های محتوا را در تصاویر شناسایی و طبقه بندی کنید تا از ترتیب صحیح متن استخراج شده اطمینان حاصل شود.

AI پس از پردازش با استفاده از LLMS

نه فقط OCR-راه حل هوش مصنوعی همه در یک برای تشخیص متن هوشمندتر و بدون خطا. Aspose.ocr اکنون AI و LLMS را برای انتخاب مدل هایی که به طور قابل توجهی دقت OCR را افزایش می دهد - خطاهای پر کردن ، بازگرداندن متن از دست رفته و بهبود کیفیت تشخیص کلی ، ادغام می کند.

نمونه کد زنده

.NET OCR حتی برای توسعه دهندگان جدید به یک کار بی اهمیت و سر راست تبدیل می شود. فقط چند خط کد برای استخراج متن از یک تصویر و نمایش آن بر روی صفحه کافی است. واقعاً خیلی ساده است - امتحان کنید.

آماده تشخیص آماده تشخیص یک فایل را در اینجا رها کنید یا برای مرور * کلیک کنید

* با بارگذاری پرونده های خود یا استفاده از خدماتی که با ما موافق هستید شرایط استفاده وت سیاست حفظ حریم.

نتیجه تشخیص
 

تبدیل تصویر به متن

نمونه های بیشتر >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

استقلال

کتابخانه Cross-Platform OCR می تواند در همه جا در زیر .NET ، .NET Core یا .NET Framework-چه در یک دستگاه محلی ، در سرور وب و یا در ابر کار کند.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

قالب های فایل پشتیبانی شده

Aspose.OCR for .NET می تواند با هر [پرونده]کار کند( https://docs.aspose.com/ocr/net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد ، به یک پایگاه داده وارد کرد یا در زمان واقعی مورد تجزیه و تحلیل قرار گرفت.

تصاویر

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

دسته OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

نتایج تشخیص

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

LLM OCR: نسل بعدی OCR که توسط مدل های زبان AI هدایت می شود.

دقت نتیجه در تشخیص متوقف نمی شود - با پالایش متن با استفاده از LLM های خارجی ، سطح بعدی کیفیت را باز کنید.

  • به طور خودکار املا و دستور زبان را در متن شناخته شده اصلاح کنید.
  • ناسازگاری ها و موضوعات قالب بندی را در اسکن های چند صفحه ای عادی کنید.
  • نتایج تشخیص را با واژگان خاص موضوع با استفاده از مدل های سریع محور سازگار کنید.
  • هر خط لوله LLM خارجی را فقط با چند خط کد در گردش کار OCR خود ادغام کنید.

مناسب برای هر محتوا

صحت و قابلیت اطمینان تشخیص متن در C# تا حد زیادی به کیفیت تصویر بستگی دارد. .NET OCR مجموعه کاملی از بهینه سازی تصویر خودکار و دستی را ارائه می دهد و از نتایج تشخیص برتر اطمینان می دهد.

پردازش قدرتمند تصویر ، تشخیص متن کاملاً قابل تنظیم ، پس از پردازش و تصحیح املای خودکار ، استخراج متن را از هر اسکن یا عکس با بالاترین دقت فعال می کند.

بهینه سازی منابع OCR

به عنوان کتابخانه C# OCR ، تعادل بسیار انعطاف پذیر سرعت ، کیفیت و استفاده از منابع را برای هر مورد استفاده خاص امکان پذیر می کند:

  • بین شناخت کامل و شناخت سریع را انتخاب کنید.
  • تعداد موضوعات اختصاص یافته برای تشخیص را مشخص کنید ، یا به کتابخانه .NET OCR ما اجازه دهید تا به طور خودکار به تعداد هسته های پردازنده مقیاس بندی کند.
  • CPU را با بارگذاری محاسبات به GPU آزاد کنید.

140+ زبان تشخیص

کتابخانه C# OCR ما یک راه حل جهانی برای پردازش اسناد ، استخراج داده ها و دیجیتالی شدن محتوا در مقیاس جهانی است. با حمایت از طیف گسترده ای از اسکریپت های نوشتن اروپایی ، خاورمیانه و آسیایی ، برای هر کشور و تجارت سازگار است.

شما می توانید اسنادی را که به زبان های مختلط نوشته شده است ، مانند چینی/انگلیسی ، عربی/فرانسوی یا سیریلیک/انگلیسی بشناسید. زبانهای زیر پشتیبانی می شوند:

  • ** گسترش یافته لاتین **: انگلیسی ، اسپانیایی ، فرانسوی ، اندونزی ، پرتغالی ، آلمانی ، ویتنامی ، ترکی ، ایتالیایی ، لهستانی و 80+ بیشتر.
  • ** سیریلیک ** الفبای: روسی ، اوکراینی ، قزاق ، بلغاری ، از جمله متون مخلوط سیریلیک/انگلیسی.
  • عربی ، فارسی ، اردو ، از جمله متون مخلوط با انگلیسی.
  • زبان های چینی ، کره ای ، ژاپنی ، Devanagari و Dravidian ، از جمله هندی ، تامیل ، مراتی و دیگران.

ویژگی ها و قابلیت ها

C# OCR به طور خودکار متن را از عکس ها یا اسکن ها استخراج می کند و نیاز به بازپرداخت دستی اسناد را از بین می برد.

Feature icon

عکس OCR

متن را از عکس های تلفن هوشمند با دقت در سطح اسکن استخراج کنید.

Feature icon

PDF قابل جستجو

هر اسکن را به یک سند کاملاً قابل جستجو و شاخص تبدیل کنید.

Feature icon

شناخت URL

بدون بارگیری در محلی ، تصویری را از URL تشخیص دهید.

Feature icon

شناخت انبوه

تمام تصاویر را از اسناد ، پوشه ها و بایگانی های چند صفحه ای بخوانید.

Feature icon

هر قلم و سبک

متن را در همه نوع و سبک های محبوب شناسایی و تشخیص دهید.

Feature icon

شناخت تنظیم دقیق

هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.

Feature icon

طلسم طلسم

با اصلاح خودکار کلمات غلط املایی ، نتایج را بهبود بخشید.

Feature icon

متن را در تصاویر پیدا کنید

متن یا بیان منظم را در مجموعه ای از تصاویر جستجو کنید.

Feature icon

متون تصویر را مقایسه کنید

متون را بدون در نظر گرفتن مورد و چیدمان بر روی دو تصویر مقایسه کنید.

Feature icon

تصحیح شده

با استفاده از LLMS مبتنی بر ترانسفورماتور ، کلمات و دستور زبان را به رسمیت شناخته شده برطرف کنید-آموزش سفارشی لازم نیست.

Feature icon

پس پردازش معنایی

فراتر از شخصیت ها: برای بهبود کیفیت محتوا و عادی سازی زبان ، خروجی OCR پر سر و صدا را با LLMS اصلاح کنید.

Feature icon

خطوط لوله Plug-in LLM

برای اصلاح اشتباهات تشخیص OCR و بازگرداندن متن ناقص یا تکه تکه ، مدل های زبان خارجی را به هم وصل کنید.

استفاده از OCR آسان است

با استفاده از C# OCR API ، شما فقط به چند خط C# کد برای تبدیل تصویر به متن نیاز دارید ، یک PDF قابل جستجو ایجاد کنید ، نتایج تشخیص را ذخیره کنید تا مستند شود و بسیاری موارد دیگر. برای درک چگونگی ادغام API OCR ما در راه حل های دات نت خود ، نمونه های کد را کاوش کنید.

نصب

.NET OCR به عنوان یک بسته Nuget یا به عنوان پرونده قابل بارگیری با حداقل وابستگی توزیع می شود. این بسته را می توان مستقیماً از Microsoft Visual Studio به پروژه شما اضافه کرد. به سادگی آن را روی پروژه خود نصب کنید و شما آماده استخراج متن از تصاویر و ذخیره نتایج تشخیص در هر یک از قالب های پشتیبانی شده هستید. اگر سیستم شما دارای یک GPU با قابلیت CUDA است ، می توانید از GPU-Accelerated Engine OCR استفاده کنید تا عملکرد تشخیص را به میزان قابل توجهی افزایش دهید.

شما می توانید بلافاصله پس از نصب با برخی [محدودیت ها]استفاده کنید. مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از آن استفاده کنید تا یک برنامه OCR کاملاً کاربردی را شروع کنید و تصمیم نهایی برای خرید OCR را برای دات NET بعداً بگیرید.

متن را از یک عکس استخراج کنید

هنگامی که افراد به طور معمول به OCR (تشخیص شخصیت نوری) فکر می کنند ، اولین ارتباط اغلب با یک اسکنر به عنوان دستگاه ضبط اولیه است. این انجمن دلایل تاریخی دارد و هنوز هم در بسیاری از زمینه ها شیوع دارد و محیطی مداوم و کنترل شده را برای ضبط متن چاپ شده از اسناد فیزیکی با کیفیت بی نظیر فراهم می کند. با این حال ، یک اسکنر تجهیزات تخصصی است که همیشه در دست نیست و برای کار کردن به یک ایستگاه کاری ثابت نیاز دارد. خوشبختانه ، دنیای مدرن جایگزین مناسبی برای اسکنرهای سنتی - یک دوربین تلفن هوشمند است. پیشرفت در فناوری دوربین تلفن های هوشمند اطمینان حاصل می کند که حتی یک تلفن هوشمند در سطح ورودی کیفیت کافی را برای ضبط اسناد OCR آماده ارائه می دهد. و حافظه داخلی باعث می شود دیجیتالی کردن مقادیر زیادی اسناد ، روزنامه ها ، کتاب ها ، علائم خیابانی و سایر متن ها در حال حرکت آسانتر از همیشه باشد. تمام آنچه شما نیاز دارید فناوری مناسب برای تبدیل آن عکس ها به متن قابل خواندن با دستگاه است.

کتابخانه C# OCR ما به طور خاص برای تشخیص انواع تصاویر خارج از جعبه طراحی شده است و می تواند به خوبی تنظیم شود تا حتی عکس های با کیفیت پایین را کنترل کند. همراه با یک تلفن هوشمند مدرن ، به شما امکان می دهد برنامه های قدرتمند OCR را برای اکثر کارهای اسکن و تشخیص متن روزمره ایجاد کنید. پیشرفته ترین پردازش تصویر و تجزیه و تحلیل ساختار اسناد در چند خط کد انجام می شود و به شما امکان می دهد به جای الگوریتم های پیچیده ریاضی ، شبکه های عصبی و سایر پیچیدگی های فنی ، روی تجارت تمرکز کنید.

عکس OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

PDF قابل جستجو از اسکن ایجاد کنید

PDF یکی از محبوب ترین قالب ها برای اسکن اسناد کاغذ است ، به خصوص به دلیل توانایی آن در ترکیب چندین صفحه در یک پرونده واحد. این قالب به طور گسترده ای برای تبادل قراردادها ، فاکتورها ، اسناد حقوقی ، گذرنامه و کارت شناسایی و بسیاری از اسناد دیگر بین افراد ، مشاغل ، بانک ها و سازمان های دولتی استفاده می شود. با این حال ، هر PDF اسکن شده در اصل مجموعه ای از تصاویر است. این متن قابل خواندن با دستگاه نیست ، بنابراین کاربران نمی توانند محتوای سند را جستجو ، کپی یا در غیر این صورت دستکاری کنند.

aspose .net OCR روشی سریع ، آسان و بسیار قابل اعتماد برای تبدیل هر PDF اسکن شده به یک سند کاملاً قابل جستجو و شاخص را به شما ارائه می دهد. این محتوای صفحه را به طور دقیق تشخیص می دهد ، و آن را به یک لایه متن قابل خواندن بر روی تصویر اصلی تبدیل می کند که می تواند انتخاب ، کپی ، خوانده شده توسط نرم افزار متن به گفتار ، و حتی به طور خودکار توسط مترجمان ، خلاصه کننده ها و سایر ابزارهای تحلیلی AI پردازش شود.

پوشش متن را به PDF اضافه کنید - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

متن را در تصاویر جستجو کنید

بایگانی های دیجیتال ، به ویژه در سازمان های بزرگ ، اغلب از مجموعه گسترده ای از اسکن ها و عکس ها تشکیل شده است که بسیاری از آنها ممکن است حاوی اسناد چند صفحه ای باشند. مدیریت کارآمد و سازماندهی چنین بایگانی به طور مؤثر برای بازیابی اطلاعات آسان و ناوبری ضروری است. با این حال ، تصاویر حاوی متن قابل خواندن با دستگاه نیستند ، و جستجو و تجزیه و تحلیل محتوای سند را غیرممکن می کند.

کتابخانه C# OCR به شما امکان می دهد بدون در نظر گرفتن قلم ، اندازه متن ، سبک و سایر پارامترها ، متن را در تصاویر جستجو کنید. این کتابخانه همچنین از جستجوهای حساس و عبارات منظم پشتیبانی می کند ، که در برنامه ها و صنایع مختلف بسیار مفید است. این قابلیت می تواند برای طبقه بندی اسناد بر اساس محتوا ، کلمات کلیدی یا الگوهای موجود در متن استفاده شود. جستجوی شرایط خاص یا بندها در توافق نامه ها و قراردادها. سازماندهی مجدد پرونده ها بر اساس کلمات کلیدی یا محتوای موجود در آنها. داده های شخصی را در اسناد پیدا و شناسایی کنید ، و اطمینان از انطباق GDPR و مدیریت مؤثرتر اطلاعات حساس را آسان تر می کند. جستجوی تصاویر با تصاویر همچنین امکان ایجاد گردش کار خودکار و ساده سازی فرآیندهای مختلف تجاری را با دریافت قراردادهای امضا شده و فاکتورها فراهم می کند.

متن را در تصاویر جستجو کنید - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

AI پس از پردازش با LLM

اکنون می توانید فراتر از شناخت خام بروید و از منطق AI محور استفاده کنید تا کیفیت متنی نتایج OCR را بهبود بخشد. مدل های بزرگ زبان (LLMS) می توانند خطاهای هجی هوشمندانه را اصلاح کنند ، مرزهای کلمه را بازیابی کنند ، قوانین گرامر را اعمال کنند و متن را بر اساس متن تطبیق دهند-کاری که طلسم های مبتنی بر نحو نمی توانند انجام دهند.

این مرحله پس از پردازش برای اسکن با کیفیت پایین ، عکس هایی با سر و صدای پس زمینه یا اسناد چند زبانه ایده آل است. شما می توانید هر خط لوله LLM را که از ورودی/خروجی اصلی متن پشتیبانی می کند ، وصل کنید ، یا از ابزارهای تصحیح هوشمند داخلی داخلی برای به دست آوردن نتایج آماده تولید استفاده کنید.

postai پردازش با LLM - C#

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();