Native OCR API برای برنامه های NET
تبدیل تصویر به متن در سی شارپ
ویترین های بیشتر >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
چرا Aspose.OCR برای دات نت؟
Aspose.OCR for .NET یک API قوی، مناسب برای توسعه و مقرون به صرفه برای تشخیص کاراکترهای نوری است. در کمتر از 10 خط کد C# بومی، می توانید قابلیت های OCR را در راه حل های دسکتاپ دات نت، برنامه های کاربردی وب مبتنی بر MVC، سرویس های ابری و عملکردهای Azure بدون سرور ایجاد کنید. متنهای قابل خواندن توسط ماشین را از اسکنها، عکسها و اسکرینشاتها استخراج کنید، صفحات اسکن شده را به پیدیافهای قابل جستجو و نمایهسازی تبدیل کنید، متن روی تصاویر را پیدا کنید و مقایسه کنید که بر روی کار تجاری تمرکز میکنند نه ریاضیات پیچیده، شبکههای عصبی، و سایر پیچیدگیهای فنی. برای کسب اطلاعات بیشتر در مورد ویژگی ها و مزایای ما، روی موارد زیر کلیک کنید.
برنامه های جهانی
متون را به خط لاتین، سیریلیک و آسیایی، از جمله بیش از 6000 حروف چینی و هندی تشخیص دهید.
همه چیز را بخوانید
متن را از هر فایلی که از طریق اسکنر یا دوربین به دست آمده است بازیابی کنید و تصاویر را مستقیماً از پیوندهای وب پردازش کنید.
نتایج قابل اعتماد
دستیابی به دقت تشخیص بالا برای همه تصاویر، از جمله تصاویری که فوکوس ندارند، چرخانده شده اند، اعوجاج دارند و نویز دارند.
تشخیص دسته
انبوه همه تصاویر را از پوشه ها و بایگانی ها تشخیص دهید. اسناد PDF چند صفحه ای و تصاویر TIFF را بخوانید.
تشخیص چیدمان
بلوک های محتوا را در تصاویر شناسایی و دسته بندی کنید تا از ترتیب صحیح متن استخراج شده، صرف نظر از طرح بندی اطمینان حاصل کنید.
نمونه کد زنده
تشخیص نوری کاراکترها با Aspose.OCR، حتی برای توسعه دهندگانی که با این فناوری تازه کار هستند، به یک کار بی اهمیت و ساده تبدیل می شود. تنها چند خط کد برای استخراج متن از یک تصویر و نمایش آن بر روی صفحه کافی است. واقعاً به همین سادگی است - آن را امتحان کنید.
* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.
تبدیل تصویر به متن
نمونه های بیشتر >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
استقلال سکو
Aspose.OCR برای دات نت می تواند بر روی هر پلتفرمی که از .NET، .NET Core یا .NET Framework پشتیبانی می کند، کار کند. ماشین، روی سرور وب یا در فضای ابری.
فرمت های فایل پشتیبانی شده
Aspose.OCR for .NET می تواند تقریباً با هر [فایل]کار کند( https://docs.aspose.com/ocr/net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج شناسایی در محبوبترین فرمتهای فایل و تبادل داده که میتوانند ذخیره شوند، به پایگاه داده وارد شوند یا در زمان واقعی تجزیه و تحلیل شوند، بازگردانده میشوند.
تصاویر
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR دسته ای
- Multi-page PDF
- DjVu
- ZIP
- Folder
نتایج تشخیص
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
مناسب برای هر محتوایی
دقت و قابلیت اطمینان تشخیص متن به شدت به کیفیت تصویر اصلی بستگی دارد. Aspose.OCR for .NET طیف گسترده ای از فیلترهای پردازش تصویر کاملاً خودکار و دستی را ارائه می دهد که تصویر را قبل از ارسال به موتور OCR بهبود می بخشد.
پردازش تصویر قدرتمند و الگوریتمهای تشخیص ساختار محتوا قابل تنظیم، استخراج متن را تقریباً از هر تصویری، از اسکنهای با کیفیت بالا گرفته تا عکسهای خیابانی، امکانپذیر میسازد. فیلترهای پردازشی متعددی را می توان روی یک تصویر اعمال کرد تا بهترین کیفیت تشخیص را به دست آورد.
بهینه سازی منابع
Aspose.OCR برای دات نت تعادل بسیار انعطاف پذیر بین سرعت تشخیص، کیفیت و استفاده از منابع را برای هر مورد خاص امکان پذیر می کند:
- بین تشخیص کامل و تشخیص سریع یکی را انتخاب کنید.
- تعداد رشته های اختصاص داده شده برای شناسایی را مشخص کنید، یا به کتابخانه اجازه دهید تا به طور خودکار به تعداد هسته های پردازنده مقیاس شود.
- با بارگذاری محاسبات در GPU، CPU را آزاد کنید.
130+ زبان تشخیص
Aspose.OCR برای دات نت یک راه حل جهانی برای پردازش اسناد، استخراج داده ها و دیجیتالی کردن محتوا در مقیاس جهانی است. با پشتیبانی از مجموعه وسیعی از اسکریپتهای نوشتاری اروپایی، خاورمیانه و آسیایی، برای هر مقیاسی مناسب است و هم برای مشاغل کوچک و متوسط و هم برای شرکتهای چند ملیتی مناسب است.
شما می توانید تشخیص زبان را به کتابخانه واگذار کنید یا به صورت دستی زبان را مشخص کنید و عملکرد تشخیص و قابلیت اطمینان را افزایش دهید. زبان های زیر پشتیبانی می شوند:
- ** الفبای لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
- ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، صربی، بلاروسی، بلغاری؛
- عربی، فارسی، اردو؛
- خط چینی و دوانگاری، از جمله هندی، مراتی، بوجپوری، و دیگران.
ویژگی ها و قابلیت ها
Aspose.OCR for .NET به طور خودکار متن را از عکس ها یا تصاویر اسکن شده استخراج می کند و نیاز به تایپ مجدد دستی اسناد را از بین می برد.
عکس OCR
استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.
PDF قابل جستجو
هر اسکن را به یک سند کاملاً قابل جستجو و فهرستبندی تبدیل کنید.
تشخیص URL
تشخیص تصویر از URL بدون بارگیری محلی.
تشخیص انبوه
تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.
هر نوع فونت و سبک
متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.
تشخیص دقیق
هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.
بررسی کننده غلط املایی
با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.
متن را در تصاویر پیدا کنید
متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.
متن های تصویری را با هم مقایسه کنید
متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.
آسان برای استفاده
برای تبدیل تصویر به متن، ایجاد یک PDF قابل جستجو، ذخیره نتایج تشخیص در سند و بسیاری موارد دیگر فقط به چند خط کد نیاز دارید. برای درک نحوه ادغام Aspose.OCR برای دات نت در راه حل های خود، نمونه کدها را کاوش کنید.
نصب و راه اندازی
میتوانید بلافاصله پس از نصب با برخی [محدودیتها]از Aspose.OCR برای داتنت استفاده کنید ( https://docs.aspose.com/ocr/net/licensing/) . مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از آن برای شروع ساختن یک برنامه OCR کاملاً کاربردی استفاده کنید و بعداً تصمیم نهایی را برای خرید Aspose.OCR برای دات نت بگیرید.
استخراج متن از عکس
هنگامی که مردم معمولاً به OCR (تشخیص کاراکتر نوری) فکر می کنند، اولین ارتباط اغلب با یک اسکنر به عنوان دستگاه ضبط اولیه است. این ارتباط دلایل تاریخی دارد و هنوز در بسیاری از زمینه ها رایج است و محیطی سازگار و کنترل شده برای گرفتن متن چاپ شده از اسناد فیزیکی با کیفیتی بی بدیل فراهم می کند. با این حال، اسکنر تجهیزات تخصصی است که همیشه در دسترس نیست و برای کار کردن به یک ایستگاه کاری ثابت نیاز دارد. خوشبختانه، دنیای مدرن جایگزین مناسبی برای اسکنرهای سنتی - دوربین گوشی هوشمند - ارائه می دهد. پیشرفتهای فناوری دوربین گوشیهای هوشمند تضمین میکند که حتی یک گوشی هوشمند سطح پایه کیفیت کافی برای ثبت اسناد OCR را فراهم میکند. و حافظه داخلی دیجیتالی کردن مقادیر زیادی از اسناد، روزنامه ها، کتاب ها، علائم خیابان ها و سایر متن ها را در حال حرکت آسان تر می کند. تنها چیزی که نیاز دارید تکنولوژی مناسب برای تبدیل آن عکس ها به متن قابل خواندن توسط ماشین است.
Aspose.OCR برای دات نت به طور خاص طراحی شده است تا همه انواع تصاویر را خارج از جعبه تشخیص دهد و می توان آن را بیشتر تنظیم کرد تا حتی عکس های با کیفیت پایین را کنترل کند. همراه با یک تلفن هوشمند مدرن، به شما امکان می دهد تا برنامه های OCR قدرتمندی را برای اکثر کارهای روزمره اسکن و تشخیص متن ایجاد کنید. پیشرفته ترین پردازش تصویر و تجزیه و تحلیل ساختار سند در چند خط کد انجام می شود و به شما امکان می دهد به جای الگوریتم های پیچیده ریاضی، شبکه های عصبی و سایر پیچیدگی های فنی، بر تجارت تمرکز کنید.
عکس OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
یک PDF قابل جستجو از اسکن ایجاد کنید
PDF یکی از محبوب ترین فرمت ها برای اسکن اسناد کاغذی است، به خصوص به دلیل توانایی آن در ترکیب چندین صفحه در یک فایل واحد. این فرمت به طور گسترده برای مبادله قراردادها، فاکتورها، اسناد قانونی، گذرنامه و کارت شناسایی و بسیاری از اسناد دیگر بین افراد، مشاغل، بانک ها و سازمان های دولتی استفاده می شود. با این حال، هر PDF اسکن شده اساسا مجموعه ای از تصاویر است. این شامل متن قابل خواندن توسط ماشین نیست، بنابراین کاربران نمی توانند محتوای سند را جستجو، کپی یا دستکاری کنند.
Aspose.OCR برای دات نت راهی سریع، آسان و بسیار قابل اعتماد برای تبدیل هر پی دی اف اسکن شده به یک سند کاملاً قابل جستجو و فهرست بندی را به شما ارائه می دهد. محتوای صفحه را به دقت تشخیص میدهد و آن را به یک لایه متنی قابل خواندن توسط ماشین روی تصویر اصلی تبدیل میکند که میتواند انتخاب شود، کپی شود، توسط نرمافزار تبدیل متن به گفتار خوانده شود، و حتی بهطور خودکار توسط مترجمها، خلاصهنویسها و سایر تجزیه و تحلیلهای مبتنی بر هوش مصنوعی پردازش شود. ابزار.
افزودن همپوشانی متن به PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
جستجوی متن در تصاویر
آرشیوهای دیجیتال، به ویژه در سازمان های بزرگ، اغلب از مجموعه وسیعی از اسکن ها و عکس ها تشکیل شده اند که بسیاری از آنها ممکن است حاوی اسناد چند صفحه ای باشند. مدیریت کارآمد و سازماندهی موثر چنین آرشیوهایی برای بازیابی و ناوبری آسان اطلاعات ضروری است. با این حال، تصاویر حاوی متن قابل خواندن توسط ماشین نیستند و جستجو و تجزیه و تحلیل محتوای سند را غیرممکن می کند.
Aspose.OCR برای دات نت به شما امکان می دهد بدون در نظر گرفتن فونت، اندازه متن، سبک و سایر پارامترها به راحتی متن را در تصاویر جستجو کنید. این کتابخانه همچنین از جستجوهای حساس به حروف بزرگ و عبارات منظم پشتیبانی می کند که در برنامه ها و صنایع مختلف بسیار مفید است. این قابلیت می تواند برای دسته بندی اسناد بر اساس محتوا، کلمات کلیدی یا الگوهای موجود در متن استفاده شود. جستجو برای شرایط یا بندهای خاص در توافقات و قراردادها؛ سازماندهی مجدد فایل ها بر اساس کلمات کلیدی یا محتوای موجود در آنها؛ پیدا کردن و شناسایی داده های شخصی در اسناد، اطمینان از مطابقت با GDPR و مدیریت موثرتر اطلاعات حساس را آسان تر می کند. جستجوی درون تصاویر همچنین امکان ایجاد گردشهای کاری خودکار و سادهسازی فرآیندهای مختلف تجاری را پس از دریافت قراردادها و فاکتورهای امضا شده فراهم میکند.
جستجوی متن در تصاویر - سی شارپ
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}