چرا Aspose.OCR برای دات نت؟

Aspose.OCR for .NET یک API قوی، مناسب برای توسعه و مقرون به صرفه برای تشخیص کاراکترهای نوری است. در کمتر از 10 خط کد C# بومی، می توانید قابلیت های OCR را در راه حل های دسکتاپ دات نت، برنامه های کاربردی وب مبتنی بر MVC، سرویس های ابری و عملکردهای Azure بدون سرور ایجاد کنید. متن‌های قابل خواندن توسط ماشین را از اسکن‌ها، عکس‌ها و اسکرین‌شات‌ها استخراج کنید، صفحات اسکن شده را به پی‌دی‌اف‌های قابل جستجو و نمایه‌سازی تبدیل کنید، متن روی تصاویر را پیدا کنید و مقایسه کنید که بر روی کار تجاری تمرکز می‌کنند نه ریاضیات پیچیده، شبکه‌های عصبی، و سایر پیچیدگی‌های فنی. برای کسب اطلاعات بیشتر در مورد ویژگی ها و مزایای ما، روی موارد زیر کلیک کنید.

Illustration ocr

برنامه های جهانی

متون را به خط لاتین، سیریلیک و آسیایی، از جمله بیش از 6000 حروف چینی و هندی تشخیص دهید.

همه چیز را بخوانید

متن را از هر فایلی که از طریق اسکنر یا دوربین به دست آمده است بازیابی کنید و تصاویر را مستقیماً از پیوندهای وب پردازش کنید.

نتایج قابل اعتماد

دستیابی به دقت تشخیص بالا برای همه تصاویر، از جمله تصاویری که فوکوس ندارند، چرخانده شده اند، اعوجاج دارند و نویز دارند.

تشخیص دسته

انبوه همه تصاویر را از پوشه ها و بایگانی ها تشخیص دهید. اسناد PDF چند صفحه ای و تصاویر TIFF را بخوانید.

تشخیص چیدمان

بلوک های محتوا را در تصاویر شناسایی و دسته بندی کنید تا از ترتیب صحیح متن استخراج شده، صرف نظر از طرح بندی اطمینان حاصل کنید.

نمونه کد زنده

تشخیص نوری کاراکترها با Aspose.OCR، حتی برای توسعه دهندگانی که با این فناوری تازه کار هستند، به یک کار بی اهمیت و ساده تبدیل می شود. تنها چند خط کد برای استخراج متن از یک تصویر و نمایش آن بر روی صفحه کافی است. واقعاً به همین سادگی است - آن را امتحان کنید.

آماده تشخیص آماده تشخیص یک فایل را اینجا رها کنید یا برای مرور کلیک کنید *

* با آپلود فایل های خود یا استفاده از سرویس با ما موافقت می کنید شرایط استفاده و سیاست حفظ حریم خصوصی.

نتیجه شناخت
 

تبدیل تصویر به متن

نمونه های بیشتر >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

استقلال سکو

Aspose.OCR برای دات نت می تواند بر روی هر پلتفرمی که از .NET، .NET Core یا .NET Framework پشتیبانی می کند، کار کند. ماشین، روی سرور وب یا در فضای ابری.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

فرمت های فایل پشتیبانی شده

Aspose.OCR for .NET می تواند تقریباً با هر [فایل]کار کند( https://docs.aspose.com/ocr/net/supported-file-formats/ ) می توانید از یک اسکنر یا دوربین دریافت کنید. نتایج شناسایی در محبوب‌ترین فرمت‌های فایل و تبادل داده که می‌توانند ذخیره شوند، به پایگاه داده وارد شوند یا در زمان واقعی تجزیه و تحلیل شوند، بازگردانده می‌شوند.

تصاویر

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR دسته ای

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

نتایج تشخیص

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

مناسب برای هر محتوایی

دقت و قابلیت اطمینان تشخیص متن به شدت به کیفیت تصویر اصلی بستگی دارد. Aspose.OCR for .NET طیف گسترده ای از فیلترهای پردازش تصویر کاملاً خودکار و دستی را ارائه می دهد که تصویر را قبل از ارسال به موتور OCR بهبود می بخشد.

پردازش تصویر قدرتمند و الگوریتم‌های تشخیص ساختار محتوا قابل تنظیم، استخراج متن را تقریباً از هر تصویری، از اسکن‌های با کیفیت بالا گرفته تا عکس‌های خیابانی، امکان‌پذیر می‌سازد. فیلترهای پردازشی متعددی را می توان روی یک تصویر اعمال کرد تا بهترین کیفیت تشخیص را به دست آورد.

بهینه سازی منابع

Aspose.OCR برای دات نت تعادل بسیار انعطاف پذیر بین سرعت تشخیص، کیفیت و استفاده از منابع را برای هر مورد خاص امکان پذیر می کند:

  • بین تشخیص کامل و تشخیص سریع یکی را انتخاب کنید.
  • تعداد رشته های اختصاص داده شده برای شناسایی را مشخص کنید، یا به کتابخانه اجازه دهید تا به طور خودکار به تعداد هسته های پردازنده مقیاس شود.
  • با بارگذاری محاسبات در GPU، CPU را آزاد کنید.

130+ زبان تشخیص

Aspose.OCR برای دات نت یک راه حل جهانی برای پردازش اسناد، استخراج داده ها و دیجیتالی کردن محتوا در مقیاس جهانی است. با پشتیبانی از مجموعه وسیعی از اسکریپت‌های نوشتاری اروپایی، خاورمیانه و آسیایی، برای هر مقیاسی مناسب است و هم برای مشاغل کوچک و متوسط ​​و هم برای شرکت‌های چند ملیتی مناسب است.

شما می توانید تشخیص زبان را به کتابخانه واگذار کنید یا به صورت دستی زبان را مشخص کنید و عملکرد تشخیص و قابلیت اطمینان را افزایش دهید. زبان های زیر پشتیبانی می شوند:

  • ** الفبای لاتین توسعه یافته **: انگلیسی، اسپانیایی، فرانسوی، اندونزیایی، پرتغالی، آلمانی، ویتنامی، ترکی، ایتالیایی، لهستانی، و بیش از 80 مورد دیگر.
  • ** الفبای سیریلیک **: روسی، اوکراینی، قزاقستانی، صربی، بلاروسی، بلغاری؛
  • عربی، فارسی، اردو؛
  • خط چینی و دوانگاری، از جمله هندی، مراتی، بوجپوری، و دیگران.

ویژگی ها و قابلیت ها

Aspose.OCR for .NET به طور خودکار متن را از عکس ها یا تصاویر اسکن شده استخراج می کند و نیاز به تایپ مجدد دستی اسناد را از بین می برد.

Feature icon

عکس OCR

استخراج متن از عکس های تلفن هوشمند با دقت سطح اسکن.

Feature icon

PDF قابل جستجو

هر اسکن را به یک سند کاملاً قابل جستجو و فهرست‌بندی تبدیل کنید.

Feature icon

تشخیص URL

تشخیص تصویر از URL بدون بارگیری محلی.

Feature icon

تشخیص انبوه

تمام تصاویر را از اسناد چند صفحه ای، پوشه ها و بایگانی ها بخوانید.

Feature icon

هر نوع فونت و سبک

متن را در تمام حروف و سبک های رایج شناسایی و تشخیص دهید.

Feature icon

تشخیص دقیق

هر پارامتر OCR را برای بهترین نتایج تشخیص تنظیم کنید.

Feature icon

بررسی کننده غلط املایی

با تصحیح خودکار کلمات غلط املایی، نتایج را بهبود بخشید.

Feature icon

متن را در تصاویر پیدا کنید

متن یا عبارت منظم را در مجموعه ای از تصاویر جستجو کنید.

Feature icon

متن های تصویری را با هم مقایسه کنید

متن ها را در دو تصویر، صرف نظر از ابعاد و طرح بندی، مقایسه کنید.

آسان برای استفاده

برای تبدیل تصویر به متن، ایجاد یک PDF قابل جستجو، ذخیره نتایج تشخیص در سند و بسیاری موارد دیگر فقط به چند خط کد نیاز دارید. برای درک نحوه ادغام Aspose.OCR برای دات نت در راه حل های خود، نمونه کدها را کاوش کنید.

نصب و راه اندازی

Aspose.OCR برای دات نت به عنوان یک بسته NuGet یا به عنوان یک فایل قابل دانلود توزیع می شود ocr/net/) با حداقل وابستگی. این بسته را می توان مستقیماً از Microsoft Visual Studio به پروژه شما اضافه کرد. به سادگی آن را در پروژه خود نصب کنید و آماده استخراج متن از تصاویر و ذخیره نتایج تشخیص در هر یک از فرمت های پشتیبانی شده هستید. اگر سیستم شما دارای یک GPU با قابلیت CUDA است، می‌توانید از موتور OCR با شتاب GPU برای افزایش قابل توجه عملکرد تشخیص استفاده کنید.

می‌توانید بلافاصله پس از نصب با برخی [محدودیت‌ها]از Aspose.OCR برای دات‌نت استفاده کنید ( https://docs.aspose.com/ocr/net/licensing/) . مجوز موقت تمام محدودیت های نسخه آزمایشی را به مدت 30 روز حذف می کند. از آن برای شروع ساختن یک برنامه OCR کاملاً کاربردی استفاده کنید و بعداً تصمیم نهایی را برای خرید Aspose.OCR برای دات نت بگیرید.

استخراج متن از عکس

هنگامی که مردم معمولاً به OCR (تشخیص کاراکتر نوری) فکر می کنند، اولین ارتباط اغلب با یک اسکنر به عنوان دستگاه ضبط اولیه است. این ارتباط دلایل تاریخی دارد و هنوز در بسیاری از زمینه ها رایج است و محیطی سازگار و کنترل شده برای گرفتن متن چاپ شده از اسناد فیزیکی با کیفیتی بی بدیل فراهم می کند. با این حال، اسکنر تجهیزات تخصصی است که همیشه در دسترس نیست و برای کار کردن به یک ایستگاه کاری ثابت نیاز دارد. خوشبختانه، دنیای مدرن جایگزین مناسبی برای اسکنرهای سنتی - دوربین گوشی هوشمند - ارائه می دهد. پیشرفت‌های فناوری دوربین گوشی‌های هوشمند تضمین می‌کند که حتی یک گوشی هوشمند سطح پایه کیفیت کافی برای ثبت اسناد OCR را فراهم می‌کند. و حافظه داخلی دیجیتالی کردن مقادیر زیادی از اسناد، روزنامه ها، کتاب ها، علائم خیابان ها و سایر متن ها را در حال حرکت آسان تر می کند. تنها چیزی که نیاز دارید تکنولوژی مناسب برای تبدیل آن عکس ها به متن قابل خواندن توسط ماشین است.

Aspose.OCR برای دات نت به طور خاص طراحی شده است تا همه انواع تصاویر را خارج از جعبه تشخیص دهد و می توان آن را بیشتر تنظیم کرد تا حتی عکس های با کیفیت پایین را کنترل کند. همراه با یک تلفن هوشمند مدرن، به شما امکان می دهد تا برنامه های OCR قدرتمندی را برای اکثر کارهای روزمره اسکن و تشخیص متن ایجاد کنید. پیشرفته ترین پردازش تصویر و تجزیه و تحلیل ساختار سند در چند خط کد انجام می شود و به شما امکان می دهد به جای الگوریتم های پیچیده ریاضی، شبکه های عصبی و سایر پیچیدگی های فنی، بر تجارت تمرکز کنید.

عکس OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

یک PDF قابل جستجو از اسکن ایجاد کنید

PDF یکی از محبوب ترین فرمت ها برای اسکن اسناد کاغذی است، به خصوص به دلیل توانایی آن در ترکیب چندین صفحه در یک فایل واحد. این فرمت به طور گسترده برای مبادله قراردادها، فاکتورها، اسناد قانونی، گذرنامه و کارت شناسایی و بسیاری از اسناد دیگر بین افراد، مشاغل، بانک ها و سازمان های دولتی استفاده می شود. با این حال، هر PDF اسکن شده اساسا مجموعه ای از تصاویر است. این شامل متن قابل خواندن توسط ماشین نیست، بنابراین کاربران نمی توانند محتوای سند را جستجو، کپی یا دستکاری کنند.

Aspose.OCR برای دات نت راهی سریع، آسان و بسیار قابل اعتماد برای تبدیل هر پی دی اف اسکن شده به یک سند کاملاً قابل جستجو و فهرست بندی را به شما ارائه می دهد. محتوای صفحه را به دقت تشخیص می‌دهد و آن را به یک لایه متنی قابل خواندن توسط ماشین روی تصویر اصلی تبدیل می‌کند که می‌تواند انتخاب شود، کپی شود، توسط نرم‌افزار تبدیل متن به گفتار خوانده شود، و حتی به‌طور خودکار توسط مترجم‌ها، خلاصه‌نویس‌ها و سایر تجزیه و تحلیل‌های مبتنی بر هوش مصنوعی پردازش شود. ابزار.

افزودن همپوشانی متن به PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

جستجوی متن در تصاویر

آرشیوهای دیجیتال، به ویژه در سازمان های بزرگ، اغلب از مجموعه وسیعی از اسکن ها و عکس ها تشکیل شده اند که بسیاری از آنها ممکن است حاوی اسناد چند صفحه ای باشند. مدیریت کارآمد و سازماندهی موثر چنین آرشیوهایی برای بازیابی و ناوبری آسان اطلاعات ضروری است. با این حال، تصاویر حاوی متن قابل خواندن توسط ماشین نیستند و جستجو و تجزیه و تحلیل محتوای سند را غیرممکن می کند.

Aspose.OCR برای دات نت به شما امکان می دهد بدون در نظر گرفتن فونت، اندازه متن، سبک و سایر پارامترها به راحتی متن را در تصاویر جستجو کنید. این کتابخانه همچنین از جستجوهای حساس به حروف بزرگ و عبارات منظم پشتیبانی می کند که در برنامه ها و صنایع مختلف بسیار مفید است. این قابلیت می تواند برای دسته بندی اسناد بر اساس محتوا، کلمات کلیدی یا الگوهای موجود در متن استفاده شود. جستجو برای شرایط یا بندهای خاص در توافقات و قراردادها؛ سازماندهی مجدد فایل ها بر اساس کلمات کلیدی یا محتوای موجود در آنها؛ پیدا کردن و شناسایی داده های شخصی در اسناد، اطمینان از مطابقت با GDPR و مدیریت موثرتر اطلاعات حساس را آسان تر می کند. جستجوی درون تصاویر همچنین امکان ایجاد گردش‌های کاری خودکار و ساده‌سازی فرآیندهای مختلف تجاری را پس از دریافت قراردادها و فاکتورهای امضا شده فراهم می‌کند.

جستجوی متن در تصاویر - سی شارپ

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}