کتابخانه C# OCR برای برنامه های NET
تبدیل تصویر به متن در C# OCR
ویترین های بیشتر >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
چرا کتابخانه Aspose OCR را انتخاب کنید؟
قابلیت های OCR قدرتمند را در چند ثانیه در برنامه های دات نت خود ایجاد کنید. OCR API با استفاده آسان ما به شما امکان می دهد متن را از تصاویر و اسکن استخراج کنید، PDF قابل جستجو و موارد دیگر را با حداقل کد C# ایجاد کنید. ایده آل برای دسکتاپ دات نت، وب، ابر و توابع بدون سرور. برای کسب اطلاعات بیشتر در مورد ویژگی ها و مزایای ما، روی موارد زیر کلیک کنید.
برنامه های جهانی OCR
C# OCR متون انگلیسی، سیریلیک، عربی، فارسی، چینی، ژاپنی، کرهای، هندی، تامیل و متون ترکیبی را تشخیص میدهد.
همه چیز را بخوانید
متن را از هر فایلی که از طریق یک اسکنر یا دوربین به دست آمده است دریافت کنید و تصاویر را مستقیماً از پیوندهای وب پردازش کنید.
نتایج قابل اعتماد
دستیابی به دقت تشخیص بالا برای همه تصاویر، از جمله تصاویری که فوکوس ندارند، چرخانده شده اند، اعوجاج دارند و نویز دارند.
تشخیص دسته
انبوه همه تصاویر را از پوشه ها و بایگانی ها تشخیص دهید. اسناد PDF چند صفحه ای و تصاویر TIFF را بخوانید.
تشخیص چیدمان
بلوک های محتوا را در تصاویر شناسایی و دسته بندی کنید تا از ترتیب صحیح متن استخراج شده، صرف نظر از طرح بندی اطمینان حاصل کنید.
نمونه کد زنده
.NET OCR با Aspose OCR API حتی برای توسعه دهندگان جدید به یک کار بی اهمیت و ساده تبدیل می شود. تنها چند خط کد برای استخراج متن از یک تصویر و نمایش آن بر روی صفحه کافی است. واقعاً به همین سادگی است - آن را امتحان کنید.
* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.
تبدیل تصویر به متن
نمونه های بیشتر >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
استقلال سکو
کتابخانه OCR بین پلتفرمی میتواند در همه جا تحت .NET، .NET Core یا .NET Framework کار کند - چه در یک ماشین محلی، چه در وب سرور یا در فضای ابری.
فرمت های فایل پشتیبانی شده
Aspose.OCR for .NET می تواند با هر [فایل]کار کند( https://docs.aspose.com/ocr/net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج تشخیص را می توان ذخیره کرد، به یک پایگاه داده وارد کرد، یا در زمان واقعی تجزیه و تحلیل کرد.
تصاویر
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR دسته ای
- Multi-page PDF
- DjVu
- ZIP
- Folder
نتایج شناسایی
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
مناسب برای هر محتوایی
دقت و قابلیت اطمینان تشخیص متن در سی شارپ تا حد زیادی به کیفیت تصویر بستگی دارد. .NET OCR مجموعه کاملی از بهینه سازی خودکار و دستی تصویر را ارائه می دهد که نتایج تشخیص برتر را تضمین می کند.
پردازش تصویر قدرتمند، تشخیص متن کاملاً قابل تنظیم، پس از پردازش، و تصحیح املای خودکار، استخراج متن از هر اسکن یا عکس را با بالاترین دقت ممکن میسازد.
بهینه سازی منابع OCR
کتابخانه Aspose C# OCR تعادل بسیار انعطافپذیری را بین سرعت تشخیص، کیفیت و استفاده از منابع برای هر مورد خاص امکانپذیر میسازد:
- بین تشخیص کامل و تشخیص سریع یکی را انتخاب کنید.
- تعداد رشته های اختصاص داده شده برای شناسایی را مشخص کنید، یا اجازه دهید کتابخانه OCR دات نت ما به طور خودکار به تعداد هسته های پردازنده مقیاس شود.
- با بارگذاری محاسبات در GPU، CPU را آزاد کنید.
140+ زبان تشخیص
کتابخانه C# OCR ما یک راه حل جهانی برای پردازش اسناد، استخراج داده ها و دیجیتالی کردن محتوا در مقیاس جهانی است. با پشتیبانی از مجموعه گسترده ای از اسکریپت های نوشتاری اروپایی، خاورمیانه و آسیایی، برای هر کشور و تجارتی به خوبی سازگار است.
شما می توانید اسناد نوشته شده به زبان های ترکیبی، مانند چینی/انگلیسی، عربی/فرانسوی یا سیریلیک/انگلیسی را تشخیص دهید. زبان های زیر پشتیبانی می شوند:
- ** لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
- ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، بلغاری، از جمله متون ترکیبی سیریلیک/انگلیسی.
- عربی، فارسی، اردو، از جمله متون آمیخته با انگلیسی.
- زبان های چینی، کره ای، ژاپنی، دوانگاری و دراویدی، از جمله هندی، تامیل، مراتی و غیره.
ویژگی ها و قابلیت ها
C# OCR به طور خودکار متن را از عکس ها یا اسکن ها استخراج می کند و نیاز به تایپ مجدد دستی اسناد را از بین می برد.
عکس OCR
استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.
PDF قابل جستجو
هر اسکن را به یک سند کاملاً قابل جستجو و فهرستبندی تبدیل کنید.
تشخیص URL
تشخیص تصویر از URL بدون بارگیری محلی.
تشخیص انبوه
تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.
هر نوع فونت و سبک
متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.
تشخیص دقیق
هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.
غلط گیر املا
با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.
متن را در تصاویر پیدا کنید
متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.
متن های تصویری را با هم مقایسه کنید
متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.
استفاده آسان از OCR
با C# OCR API ما، فقط به چند خط کد C# برای تبدیل تصویر به متن، ایجاد PDF قابل جستجو، ذخیره نتایج تشخیص در سند و بسیاری موارد دیگر نیاز دارید. برای درک نحوه ادغام OCR API ما در راه حل های NET خود، نمونه کدها را کاوش کنید.
نصب و راه اندازی
میتوانید بلافاصله پس از نصب با برخی [محدودیتها]از Aspose OCR برای داتنت استفاده کنید ( https://docs.aspose.com/ocr/net/licensing/) . مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از آن برای شروع ساخت یک برنامه OCR کاملاً کاربردی استفاده کنید و بعداً تصمیم نهایی را برای خرید OCR برای دات نت بگیرید.
استخراج متن از عکس
هنگامی که مردم معمولاً به OCR (تشخیص کاراکتر نوری) فکر می کنند، اولین ارتباط اغلب با یک اسکنر به عنوان دستگاه ضبط اولیه است. این ارتباط دلایل تاریخی دارد و هنوز در بسیاری از زمینه ها رایج است و محیطی سازگار و کنترل شده برای گرفتن متن چاپ شده از اسناد فیزیکی با کیفیتی بی بدیل فراهم می کند. با این حال، اسکنر تجهیزات تخصصی است که همیشه در دسترس نیست و برای کار کردن به یک ایستگاه کاری ثابت نیاز دارد. خوشبختانه، دنیای مدرن جایگزین مناسبی برای اسکنرهای سنتی - دوربین گوشی هوشمند - ارائه می دهد. پیشرفتهای فناوری دوربین گوشیهای هوشمند تضمین میکند که حتی یک گوشی هوشمند سطح پایه کیفیت کافی برای ثبت اسناد OCR را فراهم میکند. و حافظه داخلی دیجیتالی کردن مقادیر زیادی از اسناد، روزنامه ها، کتاب ها، علائم خیابان ها و سایر متن ها را در حال حرکت آسان تر می کند. تنها چیزی که نیاز دارید تکنولوژی مناسب برای تبدیل آن عکس ها به متن قابل خواندن توسط ماشین است.
کتابخانه C# OCR ما بهطور خاص طراحی شده است تا همه انواع تصاویر را خارج از جعبه تشخیص دهد و میتواند برای کنترل عکسهای با کیفیت پایین بیشتر تنظیم شود. همراه با یک تلفن هوشمند مدرن، به شما امکان می دهد تا برنامه های OCR قدرتمندی را برای اکثر کارهای روزمره اسکن و تشخیص متن ایجاد کنید. پیشرفته ترین پردازش تصویر و تجزیه و تحلیل ساختار سند در چند خط کد انجام می شود و به شما امکان می دهد به جای الگوریتم های پیچیده ریاضی، شبکه های عصبی و سایر پیچیدگی های فنی، بر تجارت تمرکز کنید.
عکس OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
یک PDF قابل جستجو از اسکن ایجاد کنید
PDF یکی از محبوب ترین فرمت ها برای اسکن اسناد کاغذی است، به خصوص به دلیل توانایی آن در ترکیب چندین صفحه در یک فایل واحد. این فرمت به طور گسترده برای مبادله قراردادها، فاکتورها، اسناد قانونی، گذرنامه و کارت شناسایی و بسیاری از اسناد دیگر بین افراد، مشاغل، بانک ها و سازمان های دولتی استفاده می شود. با این حال، هر PDF اسکن شده اساسا مجموعه ای از تصاویر است. این شامل متن قابل خواندن توسط ماشین نیست، بنابراین کاربران نمی توانند محتوای سند را جستجو، کپی یا دستکاری کنند.
Aspose .NET OCR راهی سریع، آسان و بسیار قابل اعتماد برای تبدیل هر پی دی اف اسکن شده به یک سند کاملاً قابل جستجو و فهرست بندی را به شما ارائه می دهد. محتوای صفحه را به دقت تشخیص میدهد و آن را به یک لایه متنی قابل خواندن توسط ماشین روی تصویر اصلی تبدیل میکند که میتواند انتخاب شود، کپی شود، توسط نرمافزار تبدیل متن به گفتار خوانده شود، و حتی بهطور خودکار توسط مترجمها، خلاصهنویسها و سایر تجزیه و تحلیلهای مبتنی بر هوش مصنوعی پردازش شود. ابزار.
افزودن همپوشانی متن به PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
جستجوی متن در تصاویر
آرشیوهای دیجیتال، به ویژه در سازمان های بزرگ، اغلب از مجموعه وسیعی از اسکن ها و عکس ها تشکیل شده اند که بسیاری از آنها ممکن است حاوی اسناد چند صفحه ای باشند. مدیریت کارآمد و سازماندهی موثر چنین آرشیوهایی برای بازیابی و ناوبری آسان اطلاعات ضروری است. با این حال، تصاویر حاوی متن قابل خواندن توسط ماشین نیستند و جستجو و تجزیه و تحلیل محتوای سند را غیرممکن می کند.
کتابخانه C# OCR به شما امکان می دهد بدون در نظر گرفتن فونت، اندازه متن، سبک و سایر پارامترها به راحتی متن را در تصاویر جستجو کنید. این کتابخانه همچنین از جستجوهای حساس به حروف بزرگ و عبارات منظم پشتیبانی می کند که در برنامه ها و صنایع مختلف بسیار مفید است. این قابلیت می تواند برای دسته بندی اسناد بر اساس محتوا، کلمات کلیدی یا الگوهای موجود در متن استفاده شود. جستجوی شرایط یا بندهای خاص در توافقات و قراردادها؛ سازماندهی مجدد فایل ها بر اساس کلمات کلیدی یا محتوای موجود در آنها؛ پیدا کردن و شناسایی داده های شخصی در اسناد، اطمینان از مطابقت با GDPR و مدیریت موثرتر اطلاعات حساس را آسان تر می کند. جستجوی درون تصاویر همچنین امکان ایجاد گردشهای کاری خودکار و سادهسازی فرآیندهای مختلف تجاری را پس از دریافت قراردادها و فاکتورهای امضا شده فراهم میکند.
جستجوی متن در تصاویر - سی شارپ
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}