.NET uygulamaları için C# OCR kitaplığı
C# OCR'da görüntüyü metne dönüştürme
Daha fazla vitrin >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Neden Aspose OCR kütüphanesini seçmelisiniz?
.NET uygulamalarınıza saniyeler içinde güçlü OCR yetenekleri ekleyin. Kullanımı kolay OCR API’miz, minimum C# koduyla görüntülerden ve taramalardan metin çıkarmanıza, aranabilir PDF’ler oluşturmanıza ve daha fazlasını yapmanıza olanak tanır. .NET masaüstü, web, bulut ve sunucusuz işlevler için idealdir. Özelliklerimiz ve avantajlarımız hakkında daha fazla bilgi edinmek için aşağıdaki öğelere tıklayın.
Küresel OCR uygulamaları
C# OCR, İngilizce, Kiril, Arapça, Farsça, Çince, Japonca, Korece, Hintçe, Tamilce ve karma dildeki metinleri tanır.
Her şeyi okuyun
Bir tarayıcı veya kamera yoluyla elde edilen herhangi bir dosyadan metin alın ve görüntüleri doğrudan web bağlantılarından işleyin.
Güvenilir sonuçlar
Odak dışı, döndürülmüş, bozuk ve gürültülü olanlar dahil tüm görüntüler için yüksek tanıma doğruluğu elde edin.
Toplu tanıma
Klasörlerdeki ve arşivlerdeki tüm görüntüleri toplu olarak tanıyın; çok sayfalı PDF belgelerini ve TIFF görüntülerini okuyun.
Düzen algılama
Düzenden bağımsız olarak çıkarılan metnin doğru sırasını sağlamak için görüntülerdeki içerik bloklarını tanımlayın ve kategorilere ayırın.
Canlı kod örneği
.NET OCR, Aspose OCR API ile yeni geliştiriciler için bile basit ve basit bir görev haline geliyor. Bir görüntüden metin çıkarmak ve ekranda görüntülemek için yalnızca birkaç satır kod yeterlidir. Gerçekten bu kadar basit; bir deneyin.
* Dosyalarınızı yükleyerek veya hizmeti kullanarak, sözleşmemizi kabul etmiş olursunuz. Kullanım koşulları Ve Gizlilik Politikası.
Resmi metne dönüştür
Daha fazla örnek >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Platform bağımsızlığı
Platformlar arası OCR kitaplığı, ister yerel bir makinede, ister yerel bir makinede olsun, .NET, .NET Core veya .NET Framework altında her yerde çalışabilir. web sunucusunda veya bulutta.
Desteklenen dosya formatları
Aspose.OCR for .NET herhangi bir [dosya]ile çalışabilir( https://docs.aspose.com/ocr/net/supported-file-formats/ ) bir tarayıcıdan veya kameradan alabilirsiniz. Tanıma sonuçları gerçek zamanlı olarak kaydedilebilir, bir veritabanına aktarılabilir veya analiz edilebilir.
Görseller
- JPEG
- PNG
- TIFF
- BMP
- GIF
Toplu OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Tanıma sonuçları
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Her türlü içeriğe uygundur
C#’ta metin tanımanın doğruluğu ve güvenilirliği büyük ölçüde görüntü kalitesine bağlıdır. .NET OCR, üstün tanıma sonuçları sağlayan eksiksiz bir otomatik ve manuel görüntü optimizasyonu seti sunar.
Güçlü görüntü işleme, tamamen özelleştirilebilir metin algılama, son işleme ve otomatik yazım düzeltme, herhangi bir tarama veya fotoğraftan en yüksek doğrulukla metin çıkarmayı mümkün kılar.
OCR kaynak optimizasyonu
Aspose’un C# OCR kütüphanesi, her özel kullanım durumu için tanıma hızı, kalite ve kaynak kullanımı arasında son derece esnek bir denge kurulmasına olanak tanır:
- Kapsamlı tanıma ve hızlı tanıma arasında seçim yapın.
- Tanıma için ayrılan iş parçacığı sayısını belirtin veya .NET OCR kitaplığımızın işlemci çekirdeği sayısına göre otomatik olarak ölçeklenmesine izin verin.
- Hesaplamaları GPU’ya aktararak CPU’nun serbest kalmasını sağlayın.
140+ tanıma dili
C# OCR kitaplığımız, küresel ölçekte belge işleme, veri çıkarma ve içerik dijitalleştirme için evrensel bir çözümdür. Avrupa, Orta Doğu ve Asya’daki çok çeşitli yazı senaryolarını desteklemesiyle her ülkeye ve işletmeye iyi bir şekilde uyarlanmıştır.
Çince/İngilizce, Arapça/Fransızca veya Kiril/İngilizce gibi karışık dillerde yazılmış belgeleri tanıyabilirsiniz. Aşağıdaki diller desteklenmektedir:
- Genişletilmiş Latince: İngilizce, İspanyolca, Fransızca, Endonezce, Portekizce, Almanca, Vietnamca, Türkçe, İtalyanca, Lehçe ve 80’den fazla dil;
- Kiril alfabesi: Rusça, Ukraynaca, Kazakça, Bulgarca, karışık Kiril/İngilizce metinler dahil;
- Arapça, Farsça, Urduca, İngilizce ile karıştırılmış metinler dahil;
- Hintçe, Tamilce, Marathi ve diğerleri de dahil olmak üzere Çince, Korece, Japonca, Devanagari ve Dravidian dilleri.
Özellikler ve yetenekler
C# OCR, fotoğraflardan veya taramalardan otomatik olarak metin ayıklayarak belgelerin manuel olarak yeniden yazılması ihtiyacını ortadan kaldırır.
Fotoğraf OCR’si
Akıllı telefon fotoğraflarından tarama düzeyinde doğrulukla metin çıkarın.
Aranabilir PDF
Herhangi bir taramayı tamamen aranabilir ve indekslenebilir bir belgeye dönüştürün.
URL tanıma
Yerel olarak indirmeden URL’deki bir resmi tanıyın.
Toplu tanıma
Çok sayfalı belgeler, klasörler ve arşivlerdeki tüm görselleri okuyun.
Herhangi bir yazı tipi ve stil
Tüm popüler yazı tipleri ve stillerdeki metni tanımlayın ve tanıyın.
Tanıma konusunda ince ayar yapın
En iyi tanıma sonuçları için her OCR parametresini ayarlayın.
Yazım denetleyici
Yanlış yazılan sözcükleri otomatik olarak düzelterek sonuçları iyileştirin.
Resimlerdeki metni bulun
Bir dizi resim içinde metin veya normal ifade arayın.
Resim metinlerini karşılaştırın
Büyük/küçük harfe ve düzene bakılmaksızın iki görüntüdeki metinleri karşılaştırın.
Kullanımı kolay OCR
C# OCR API’miz ile görüntüyü metne dönüştürmek, aranabilir bir PDF oluşturmak, tanıma sonuçlarını belgeye kaydetmek ve çok daha fazlası için yalnızca birkaç satırlık C# koduna ihtiyacınız vardır. OCR API’mizi .NET çözümlerinize nasıl entegre edeceğinizi anlamak için kod örneklerini keşfedin.
Kurulum
Aspose OCR for .NET’i kurulumdan hemen sonra bazı kısıtlamalarla kullanmaya başlayabilirsiniz. Geçici lisans, deneme sürümünün tüm sınırlamalarını 30 gün boyunca kaldırır. Tamamen işlevsel bir OCR uygulaması oluşturmaya başlamak ve daha sonra .NET için OCR’yi satın alma konusunda nihai kararı vermek için bunu kullanın.
Fotoğraftan metin çıkarma
İnsanlar genellikle OCR’yi (Optik Karakter Tanıma) düşündüklerinde, ilk akla gelen genellikle birincil yakalama aygıtı olan tarayıcıdır. Bu ilişkinin tarihsel nedenleri vardır ve birçok bağlamda hala yaygındır; fiziksel belgelerden basılı metnin eşsiz kalitede yakalanması için tutarlı ve kontrollü bir ortam sağlar. Ancak tarayıcı, her zaman el altında bulunmayan ve çalışması için sabit bir iş istasyonu gerektiren özel bir ekipmandır. Neyse ki modern dünya, geleneksel tarayıcılara uygun bir alternatif sunuyor: akıllı telefon kamerası. Akıllı telefon kamera teknolojisindeki gelişmeler, giriş seviyesi bir akıllı telefonun bile OCR’ye hazır belgeleri yakalamak için yeterli kaliteyi sunmasını sağlar. Dahili bellek, hareket halindeyken büyük miktarda belgeyi, gazeteyi, kitabı, sokak tabelasını ve diğer metinleri dijitalleştirmeyi her zamankinden daha kolay hale getiriyor. Bu fotoğrafları makine tarafından okunabilir metne dönüştürmek için ihtiyacınız olan tek şey doğru teknolojidir.
C# OCR kitaplığımız, her türlü görseli anında tanıyacak şekilde özel olarak tasarlanmıştır ve düşük kaliteli fotoğrafları bile işleyecek şekilde daha fazla ince ayar yapılabilir. Modern bir akıllı telefonla birleştirildiğinde, günlük tarama ve metin tanıma görevlerinin çoğu için güçlü OCR uygulamaları oluşturmanıza olanak tanır. En gelişmiş görüntü işleme ve belge yapısı analizi birkaç satırlık kodla gerçekleştirilir ve karmaşık matematiksel algoritmalar, sinir ağları ve diğer teknik karmaşıklıklar yerine işe odaklanmanıza olanak tanır.
Fotoğraf OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Taramadan aranabilir bir PDF oluşturun
PDF, özellikle birden fazla sayfayı tek bir dosyada birleştirme yeteneği nedeniyle, kağıt belgeleri taramak için en popüler formatlardan biridir. Bu format, bireyler, işletmeler, bankalar ve devlet kurumları arasında sözleşmelerin, faturaların, yasal belgelerin, pasaportların ve kimlik kartlarının ve diğer birçok belgenin alışverişi için yaygın olarak kullanılmaktadır. Ancak taranan herhangi bir PDF aslında bir resim koleksiyonudur. Makine tarafından okunabilir metin içermediğinden kullanıcılar belge içeriğini arayamaz, kopyalayamaz veya başka şekilde değiştiremez.
Aspose .NET OCR, taranmış herhangi bir PDF’yi tamamen aranabilir ve indekslenebilir bir belgeye dönüştürmenin hızlı, kolay ve son derece güvenilir bir yolunu sunar. Sayfa içeriğini doğru bir şekilde tanır ve orijinal görüntünün üzerinde makine tarafından okunabilen bir metin katmanına dönüştürür; bu metin okuma yazılımı tarafından seçilebilir, kopyalanabilir, okunabilir ve hatta çevirmenler, özetleyiciler ve diğer yapay zeka destekli analitikler tarafından otomatik olarak işlenebilir. aletler.
PDF'ye metin kaplaması ekleme - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Görsellerde metin arayın
Dijital arşivler, özellikle büyük kuruluşlarda, çoğu zaman çok sayfalı belgeler içerebilen geniş bir tarama ve fotoğraf koleksiyonundan oluşur. Bu tür arşivlerin etkili bir şekilde yönetilmesi ve düzenlenmesi, bilgiye kolay erişim ve gezinme için çok önemlidir. Ancak resimler makine tarafından okunabilir metin içermediğinden belge içeriğini aramayı ve analiz etmeyi imkansız hale getirir.
C# OCR kitaplığı, yazı tipi, metin boyutu, stil ve diğer parametrelerden bağımsız olarak görüntülerdeki metni kolayca aramanıza olanak tanır. Kütüphane ayrıca, çeşitli uygulamalarda ve endüstrilerde son derece yararlı olan, büyük/küçük harfe duyarlı olmayan aramaları ve düzenli ifadeleri de destekler. Bu işlevsellik, metinde bulunan içeriğe, anahtar sözcüklere veya kalıplara göre belgeleri kategorilere ayırmak için kullanılabilir; anlaşmalar ve sözleşmeler içindeki belirli şartları veya maddeleri aramak; dosyaların içinde bulunan anahtar kelimelere veya içeriğe göre yeniden düzenlenmesi; Kişisel verileri belgelerde bulup tanımlayarak GDPR uyumluluğunu sağlamayı ve hassas bilgileri daha etkili bir şekilde yönetmeyi kolaylaştırır. Görüntülerle arama yapmak aynı zamanda otomatik iş akışları oluşturmaya ve imzalı sözleşmeler ve faturalar alındığında çeşitli iş süreçlerini kolaylaştırmaya da olanak tanır.
Görüntülerde metin arama - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}