چرا کتابخانه Aspose OCR را انتخاب کنید؟

قابلیت های OCR قدرتمند را در چند ثانیه در برنامه های دات نت خود ایجاد کنید. OCR API با استفاده آسان ما به شما امکان می دهد متن را از تصاویر و اسکن استخراج کنید، PDF قابل جستجو و موارد دیگر را با حداقل کد C# ایجاد کنید. ایده آل برای دسکتاپ دات نت، وب، ابر و توابع بدون سرور. برای کسب اطلاعات بیشتر در مورد ویژگی ها و مزایای ما، روی موارد زیر کلیک کنید.

Illustration ocr

برنامه های جهانی OCR

C# OCR متون انگلیسی، سیریلیک، عربی، فارسی، چینی، ژاپنی، کره‌ای، هندی، تامیل و متون ترکیبی را تشخیص می‌دهد.

همه چیز را بخوانید

متن را از هر فایلی که از طریق یک اسکنر یا دوربین به دست آمده است دریافت کنید و تصاویر را مستقیماً از پیوندهای وب پردازش کنید.

نتایج قابل اعتماد

دستیابی به دقت تشخیص بالا برای همه تصاویر، از جمله تصاویری که فوکوس ندارند، چرخانده شده اند، اعوجاج دارند و نویز دارند.

تشخیص دسته

انبوه همه تصاویر را از پوشه ها و بایگانی ها تشخیص دهید. اسناد PDF چند صفحه ای و تصاویر TIFF را بخوانید.

تشخیص چیدمان

بلوک های محتوا را در تصاویر شناسایی و دسته بندی کنید تا از ترتیب صحیح متن استخراج شده، صرف نظر از طرح بندی اطمینان حاصل کنید.

نمونه کد زنده

.NET OCR با Aspose OCR API حتی برای توسعه دهندگان جدید به یک کار بی اهمیت و ساده تبدیل می شود. تنها چند خط کد برای استخراج متن از یک تصویر و نمایش آن بر روی صفحه کافی است. واقعاً به همین سادگی است - آن را امتحان کنید.

آماده تشخیص آماده تشخیص یک فایل را اینجا رها کنید یا برای مرور کلیک کنید *

* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.

نتیجه شناخت
 

تبدیل تصویر به متن

نمونه های بیشتر >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

استقلال سکو

کتابخانه OCR بین پلتفرمی می‌تواند در همه جا تحت .NET، .NET Core یا .NET Framework کار کند - چه در یک ماشین محلی، چه در وب سرور یا در فضای ابری.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

فرمت های فایل پشتیبانی شده

Aspose.OCR for .NET می تواند با هر [فایل]کار کند( https://docs.aspose.com/ocr/net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد، به یک پایگاه داده وارد کرد، یا در زمان واقعی تجزیه و تحلیل کرد.

تصاویر

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR دسته ای

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

نتایج شناسایی

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

مناسب برای هر محتوایی

دقت و قابلیت اطمینان تشخیص متن در سی شارپ تا حد زیادی به کیفیت تصویر بستگی دارد. .NET OCR مجموعه کاملی از بهینه سازی خودکار و دستی تصویر را ارائه می دهد که نتایج تشخیص برتر را تضمین می کند.

پردازش تصویر قدرتمند، تشخیص متن کاملاً قابل تنظیم، پس از پردازش، و تصحیح املای خودکار، استخراج متن از هر اسکن یا عکس را با بالاترین دقت ممکن می‌سازد.

بهینه سازی منابع OCR

کتابخانه Aspose C# OCR تعادل بسیار انعطاف‌پذیری را بین سرعت تشخیص، کیفیت و استفاده از منابع برای هر مورد خاص امکان‌پذیر می‌سازد:

  • بین تشخیص کامل و تشخیص سریع یکی را انتخاب کنید.
  • تعداد رشته های اختصاص داده شده برای شناسایی را مشخص کنید، یا اجازه دهید کتابخانه OCR دات نت ما به طور خودکار به تعداد هسته های پردازنده مقیاس شود.
  • با بارگذاری محاسبات در GPU، CPU را آزاد کنید.

140+ زبان تشخیص

کتابخانه C# OCR ما یک راه حل جهانی برای پردازش اسناد، استخراج داده ها و دیجیتالی کردن محتوا در مقیاس جهانی است. با پشتیبانی از مجموعه گسترده ای از اسکریپت های نوشتاری اروپایی، خاورمیانه و آسیایی، برای هر کشور و تجارتی به خوبی سازگار است.

شما می توانید اسناد نوشته شده به زبان های ترکیبی، مانند چینی/انگلیسی، عربی/فرانسوی یا سیریلیک/انگلیسی را تشخیص دهید. زبان های زیر پشتیبانی می شوند:

  • ** لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
  • ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، بلغاری، از جمله متون ترکیبی سیریلیک/انگلیسی.
  • عربی، فارسی، اردو، از جمله متون آمیخته با انگلیسی.
  • زبان های چینی، کره ای، ژاپنی، دوانگاری و دراویدی، از جمله هندی، تامیل، مراتی و غیره.

ویژگی ها و قابلیت ها

C# OCR به طور خودکار متن را از عکس ها یا اسکن ها استخراج می کند و نیاز به تایپ مجدد دستی اسناد را از بین می برد.

Feature icon

عکس OCR

استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.

Feature icon

PDF قابل جستجو

هر اسکن را به یک سند کاملاً قابل جستجو و فهرست‌بندی تبدیل کنید.

Feature icon

تشخیص URL

تشخیص تصویر از URL بدون بارگیری محلی.

Feature icon

تشخیص انبوه

تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.

Feature icon

هر نوع فونت و سبک

متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.

Feature icon

تشخیص دقیق

هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.

Feature icon

غلط گیر املا

با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.

Feature icon

متن را در تصاویر پیدا کنید

متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.

Feature icon

متن های تصویری را با هم مقایسه کنید

متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.

استفاده آسان از OCR

با C# OCR API ما، فقط به چند خط کد C# برای تبدیل تصویر به متن، ایجاد PDF قابل جستجو، ذخیره نتایج تشخیص در سند و بسیاری موارد دیگر نیاز دارید. برای درک نحوه ادغام OCR API ما در راه حل های NET خود، نمونه کدها را کاوش کنید.

نصب و راه اندازی

NET OCR به عنوان یک بسته NuGet یا به عنوان یک فایل قابل دانلود توزیع می شود /) با حداقل وابستگی. این بسته را می توان مستقیماً از Microsoft Visual Studio به پروژه شما اضافه کرد. به سادگی آن را در پروژه خود نصب کنید و آماده استخراج متن از تصاویر و ذخیره نتایج تشخیص در هر یک از فرمت های پشتیبانی شده هستید. اگر سیستم شما دارای یک GPU با قابلیت CUDA است، می‌توانید از موتور OCR با شتاب GPU برای افزایش قابل توجه عملکرد تشخیص استفاده کنید.

می‌توانید بلافاصله پس از نصب با برخی [محدودیت‌ها]از Aspose OCR برای دات‌نت استفاده کنید ( https://docs.aspose.com/ocr/net/licensing/) . مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از آن برای شروع ساخت یک برنامه OCR کاملاً کاربردی استفاده کنید و بعداً تصمیم نهایی را برای خرید OCR برای دات نت بگیرید.

استخراج متن از عکس

هنگامی که مردم معمولاً به OCR (تشخیص کاراکتر نوری) فکر می کنند، اولین ارتباط اغلب با یک اسکنر به عنوان دستگاه ضبط اولیه است. این ارتباط دلایل تاریخی دارد و هنوز در بسیاری از زمینه ها رایج است و محیطی سازگار و کنترل شده برای گرفتن متن چاپ شده از اسناد فیزیکی با کیفیتی بی بدیل فراهم می کند. با این حال، اسکنر تجهیزات تخصصی است که همیشه در دسترس نیست و برای کار کردن به یک ایستگاه کاری ثابت نیاز دارد. خوشبختانه، دنیای مدرن جایگزین مناسبی برای اسکنرهای سنتی - دوربین گوشی هوشمند - ارائه می دهد. پیشرفت‌های فناوری دوربین گوشی‌های هوشمند تضمین می‌کند که حتی یک گوشی هوشمند سطح پایه کیفیت کافی برای ثبت اسناد OCR را فراهم می‌کند. و حافظه داخلی دیجیتالی کردن مقادیر زیادی از اسناد، روزنامه ها، کتاب ها، علائم خیابان ها و سایر متن ها را در حال حرکت آسان تر می کند. تنها چیزی که نیاز دارید تکنولوژی مناسب برای تبدیل آن عکس ها به متن قابل خواندن توسط ماشین است.

کتابخانه C# OCR ما به‌طور خاص طراحی شده است تا همه انواع تصاویر را خارج از جعبه تشخیص دهد و می‌تواند برای کنترل عکس‌های با کیفیت پایین بیشتر تنظیم شود. همراه با یک تلفن هوشمند مدرن، به شما امکان می دهد تا برنامه های OCR قدرتمندی را برای اکثر کارهای روزمره اسکن و تشخیص متن ایجاد کنید. پیشرفته ترین پردازش تصویر و تجزیه و تحلیل ساختار سند در چند خط کد انجام می شود و به شما امکان می دهد به جای الگوریتم های پیچیده ریاضی، شبکه های عصبی و سایر پیچیدگی های فنی، بر تجارت تمرکز کنید.

عکس OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

یک PDF قابل جستجو از اسکن ایجاد کنید

PDF یکی از محبوب ترین فرمت ها برای اسکن اسناد کاغذی است، به خصوص به دلیل توانایی آن در ترکیب چندین صفحه در یک فایل واحد. این فرمت به طور گسترده برای مبادله قراردادها، فاکتورها، اسناد قانونی، گذرنامه و کارت شناسایی و بسیاری از اسناد دیگر بین افراد، مشاغل، بانک ها و سازمان های دولتی استفاده می شود. با این حال، هر PDF اسکن شده اساسا مجموعه ای از تصاویر است. این شامل متن قابل خواندن توسط ماشین نیست، بنابراین کاربران نمی توانند محتوای سند را جستجو، کپی یا دستکاری کنند.

Aspose .NET OCR راهی سریع، آسان و بسیار قابل اعتماد برای تبدیل هر پی دی اف اسکن شده به یک سند کاملاً قابل جستجو و فهرست بندی را به شما ارائه می دهد. محتوای صفحه را به دقت تشخیص می‌دهد و آن را به یک لایه متنی قابل خواندن توسط ماشین روی تصویر اصلی تبدیل می‌کند که می‌تواند انتخاب شود، کپی شود، توسط نرم‌افزار تبدیل متن به گفتار خوانده شود، و حتی به‌طور خودکار توسط مترجم‌ها، خلاصه‌نویس‌ها و سایر تجزیه و تحلیل‌های مبتنی بر هوش مصنوعی پردازش شود. ابزار.

افزودن همپوشانی متن به PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

جستجوی متن در تصاویر

آرشیوهای دیجیتال، به ویژه در سازمان های بزرگ، اغلب از مجموعه وسیعی از اسکن ها و عکس ها تشکیل شده اند که بسیاری از آنها ممکن است حاوی اسناد چند صفحه ای باشند. مدیریت کارآمد و سازماندهی موثر چنین آرشیوهایی برای بازیابی و ناوبری آسان اطلاعات ضروری است. با این حال، تصاویر حاوی متن قابل خواندن توسط ماشین نیستند و جستجو و تجزیه و تحلیل محتوای سند را غیرممکن می کند.

کتابخانه C# OCR به شما امکان می دهد بدون در نظر گرفتن فونت، اندازه متن، سبک و سایر پارامترها به راحتی متن را در تصاویر جستجو کنید. این کتابخانه همچنین از جستجوهای حساس به حروف بزرگ و عبارات منظم پشتیبانی می کند که در برنامه ها و صنایع مختلف بسیار مفید است. این قابلیت می تواند برای دسته بندی اسناد بر اساس محتوا، کلمات کلیدی یا الگوهای موجود در متن استفاده شود. جستجوی شرایط یا بندهای خاص در توافقات و قراردادها؛ سازماندهی مجدد فایل ها بر اساس کلمات کلیدی یا محتوای موجود در آنها؛ پیدا کردن و شناسایی داده های شخصی در اسناد، اطمینان از مطابقت با GDPR و مدیریت موثرتر اطلاعات حساس را آسان تر می کند. جستجوی درون تصاویر همچنین امکان ایجاد گردش‌های کاری خودکار و ساده‌سازی فرآیندهای مختلف تجاری را پس از دریافت قراردادها و فاکتورهای امضا شده فراهم می‌کند.

جستجوی متن در تصاویر - سی شارپ

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}