Neden ASPOSE OCR Kütüphanesi’ni seçmelisiniz?

.NET uygulamalarınıza saniyeler içinde güçlü OCR özellikleri oluşturun. Kullanımı kolay OCR API’miz, görüntülerden ve taramalardan metin çıkarmanıza, aranabilir PDF’ler oluşturmanıza ve daha fazlasını minimal C# koduyla oluşturmanıza olanak tanır. .NET masaüstü, web, bulut ve sunucusuz işlevler için idealdir.
Sadece metni çıkarmayan, aynı zamanda AI ile anlayan ve geliştiren OCR’yi deneyimleyin. Özelliklerimiz ve avantajlarımız hakkında daha fazla bilgi edinmek için aşağıdaki öğeleri tıklayın.

Illustration ocr

Global OCR uygulamaları

C# OCR, İngilizce, Kiril, Arapça, Farsça, Çin, Japon, Korece, Hintçe, Tamil ve Karışık Dil metinlerini tanır.

Her şeyi oku

Bir tarayıcı veya kamera aracılığıyla elde edilen herhangi bir dosyadan metin alın ve görüntüleri doğrudan Web bağlantılarından işleyin.

Güvenilir sonuçlar

Odaklı, döndürülmüş, çarpık ve gürültülü olanlar da dahil olmak üzere tüm görüntüler için yüksek tanınma doğruluğu elde edin.

Toplu tanıma

Klasörlerden ve arşivlerden gelen tüm görüntüleri toplu olarak tanıyor; Çok sayfalı PDF belgeleri ve TIFF görüntüleri okuyun.

Düzen algılama

Düzenden bağımsız olarak, çıkarılan metnin doğru sırasını sağlamak için görüntülerdeki içerik bloklarını tanımlayın ve kategorize edin.

LLMS kullanarak AI sonrası işlem

Sadece OCR değil-daha akıllı, hatasız metin tanıma için hepsi bir arada AI çözümünüz. Aspose.OCR artık AI ve LLM'leri OCR doğruluğunu önemli ölçüde artıran modelleri seçmek için entegre ediyor - hataları tamamlamak, eksik metni geri yüklemek ve genel tanıma kalitesini iyileştirmek.

Canlı Kod Örneği

.NET OCR, yeni geliştiriciler için bile ASPOSE OCR API ile önemsiz ve anlaşılır bir görev haline gelir. Bir görüntüden metin çıkarmak ve ekranda görüntülemek için sadece birkaç satır kod yeterlidir. Gerçekten o kadar basit - dene.

Tanımaya hazır Tanımaya hazır Bir dosyayı buraya bırakın veya göz atmak için tıklayın *

* Dosyalarınızı yükleyerek veya kabul ettiğiniz hizmeti kullanarak Kullanım Koşulları Ve Gizlilik Politikası.

Tanıma sonucu
 

Görüntüyü metne dönüştürün

Daha fazla örnek >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Platform Bağımsızlığı

Cross-Platform OCR kütüphanesi .net, .net Core veya .net Framework-altında, yerel bir makinede, web sunucusunda veya bulutta [her yerde](her yerde]( https://docs.aspose.com/ocr/net/system-equirements/ ) çalışabilir.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Desteklenen dosya biçimleri

Aspose.OCR for .NET herhangi bir [dosya]ile çalışabilir( https://docs.aspose.com/ocr/net/supported-file-formats/ ) Bir tarayıcıdan veya kameradan alabilirsiniz. Tanıma sonuçları kaydedilebilir, bir veritabanına aktarılabilir veya gerçek zamanlı olarak analiz edilebilir.

Görüntüler

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Toplu ocr

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Tanıma sonuçları

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

LLM destekli OCR: AI dil modelleri tarafından yönlendirilen yeni nesil OCR.

Sonuç doğruluğu tanımada durmaz - harici LLM’leri kullanarak metni rafine ederek bir sonraki kalite seviyesinin kilidini açın.

  • Tanınan metinde yazım ve dilbilgisini otomatik olarak düzeltin.
  • Çok sayfalık taramalardaki tutarsızlıkları ve biçimlendirme sorunlarını normalleştirin.
  • Hızlı güdümlü modelleri kullanarak tanınma sonuçlarını konuya özgü kelime dağarcığına uyarlayın.
  • Herhangi bir harici LLM boru hattını OCR iş akışınıza sadece birkaç satır kodla entegre edin.

Herhangi bir içerik için uygun

C# ‘da metin tanımanın doğruluğu ve güvenilirliği büyük ölçüde görüntü kalitesine bağlıdır. .NET OCR, üstün tanıma sonuçları sağlayan tam bir otomatik ve manuel görüntü optimizasyonu seti sunar.

Güçlü görüntü işleme, tamamen özelleştirilebilir metin algılama, işleme sonrası ve otomatik yazım düzeltmesi, herhangi bir tarama veya fotoğraftan en yüksek doğrulukta metin çıkarma etkinleştirir.

OCR Kaynak Optimizasyonu

ASPOSE ‘C# OCR Kütüphanesi, her bir özel kullanım durumu için tanıma hızı, kalite ve kaynak kullanımının yüksek derecede esnek dengelenmesini sağlar:

  • Kapsamlı tanıma ve hızlı tanıma arasında seçim yapın.
  • Tanıma için ayrılan iş parçacığı sayısını belirtin veya .NET OCR kitaplığımızın işlemci çekirdek sayısına otomatik olarak ölçeklendirilmesine izin verin.
  • Hesaplamaları GPU’ya boşaltarak CPU’yu serbest bırakın.

140+ tanıma dili

C# OCR kütüphanemiz, küresel ölçekte belge işleme, veri çıkarma ve içerik dijitalleştirmesi için evrensel bir çözümdür. Çok çeşitli Avrupa, orta doğu ve Asya yazma senaryoları desteğiyle, herhangi bir ülke ve iş için iyi uyarlanmıştır.

Çin/İngilizce, Arapça/Fransızca veya Kiril/İngilizce gibi karışık dillerde yazılmış belgeleri tanıyabilirsiniz. Aşağıdaki diller desteklenir:

  • ** Genişletilmiş Latin **: İngilizce, İspanyolca, Fransızca, Endonezya, Portekizce, Almanca, Vietnamlılar, Türk, İtalyan, Lehçe ve 80+ daha;
  • ** Kiril ** Alfabe: Rusya, Ukrayna, Kazak, Bulgar, karışık Kiril/İngilizce metinler dahil;
  • İngilizce ile karıştırılmış metinler dahil Arapça, Farsça, Urduca;
  • Hintçe, Tamil, Marathi ve diğerleri de dahil olmak üzere Çin, Koreli, Japon, Devanagari ve Dravidian dilleri.

Özellikler ve yetenekler

C# OCR, fotoğraflardan veya taramalardan metni otomatik olarak çıkarır ve belgelerin manuel olarak yeniden yazılması ihtiyacını ortadan kaldırır.

Feature icon

Fotoğraf OCR

Akıllı telefon fotoğraflarından tarama seviyesi doğruluğu ile metin çıkarın.

Feature icon

Aranabilir PDF

Herhangi bir taramayı tamamen aranabilir ve endekslenebilir bir belgeye dönüştürün.

Feature icon

URL tanıma

Yerel olarak indirmeden bir görüntüyü URL’den tanıyın.

Feature icon

Toplu tanıma

Çok sayfalık belgelerden, klasörlerden ve arşivlerden tüm resimleri okuyun.

Feature icon

Herhangi bir yazı tipi ve stil

Tüm popüler yazı tiplerinde ve stillerindeki metni tanımlayın ve tanıyın.

Feature icon

İnce ayar tanıma

En iyi tanıma sonuçları için her OCR parametresini ayarlayın.

Feature icon

Yazım denetleyicisi

Yanlış yazılmış kelimeleri otomatik olarak düzelterek sonuçları iyileştirin.

Feature icon

Resimlerde metin bulun

Bir dizi görüntü içinde metin veya normal ifade arayın.

Feature icon

Görüntü metinlerini karşılaştırın

Dava ve düzen ne olursa olsun iki resimdeki metinleri karşılaştırın.

Feature icon

AI ile çalışan düzeltme

Transformer tabanlı LLM’leri kullanarak yanlış tanımlanan kelimeleri ve dilbilgisini düzeltin-özel eğitim gerekmez.

Feature icon

Anlamsal Post -Processess

Karakterlerin ötesine geçin: Geliştirilmiş içerik kalitesi ve dil normalizasyonu için LLMS ile gürültülü OCR çıkışını geliştirin.

Feature icon

Plug-in LLM boru hatları

OCR tanıma hatalarını düzeltmek ve eksik veya parçalanmış metni geri yüklemek için harici dil modellerini bağlayın.

Kullanımı kolay OCR

C# OCR API’mizle, görüntüyü metne dönüştürmek, aranabilir bir PDF oluşturmak, tanıma sonuçlarını belgelemek ve daha fazlasını kaydetmek için yalnızca birkaç satır C# koduna ihtiyacınız vardır. OCR API’mizi .NET çözümlerinize nasıl entegre edeceğinizi anlamak için kod örneklerini keşfedin.

Kurulum

.NET OCR, Nuget Paketi veya indirilebilir dosya olarak minimal bağımlılıklarla dağıtılır. Paket projenize doğrudan Microsoft Visual Studio’dan eklenebilir. Sadece projenize yükleyin ve resimlerden metin çıkarmaya ve desteklenen formatların herhangi birinde tanıma sonuçlarını kaydetmeye hazırsınız. Sisteminizde CUDA yetenekli bir GPU varsa, tanıma performansını önemli ölçüde artırmak için GPU-Accelerated OCR motorunu kullanabilirsiniz.

kurulumdan hemen sonra bazı kısıtlamalar ile .NET için aspose ocr kullanmaya başlayabilirsiniz. Geçici lisans, deneme sürümünün tüm sınırlamalarını 30 gün boyunca kaldırır. Tamamen işlevsel bir OCR uygulaması oluşturmaya başlamak ve .NET için OCR satın almak için nihai kararı daha sonra almak için kullanın.

Bir fotoğraftan metin çıkarın

İnsanlar tipik olarak OCR’yi (optik karakter tanıma) düşündüklerinde, ilk ilişki genellikle birincil yakalama cihazı olarak bir tarayıcıdır. Bu ilişkinin tarihsel nedenleri vardır ve birçok bağlamda hala yaygındır, bu da benzersiz kalitede fiziksel belgelerden basılı metin yakalamak için tutarlı ve kontrollü bir ortam sağlar. Bununla birlikte, bir tarayıcı her zaman elinizde olmayan ve çalıştırmak için sabit bir iş istasyonu gerektiren özel ekipmandır. Neyse ki, modern dünya, bir akıllı telefon kamerası olan geleneksel tarayıcılara uygun bir alternatif sunuyor. Akıllı telefon kamera teknolojisindeki gelişmeler, giriş seviyesi bir akıllı telefonun bile OCR’ye hazır belgeleri yakalamak için yeterli kalite sağlamasını sağlar. Ve yerleşik hafıza, hareket halindeki büyük miktarlarda belge, gazete, kitap, sokak işaretleri ve diğer metinleri dijitalleştirmeyi her zamankinden daha kolay hale getiriyor. İhtiyacınız olan tek şey, bu fotoğrafları makine okunabilir metne dönüştürmek için doğru teknoloji.

C# OCR kütüphanemiz, her türlü görüntüyü kutudan çıkaracak şekilde tanımak için özel olarak tasarlanmıştır ve düşük kaliteli fotoğrafları bile işlemek için daha ince ayarlanabilir. Modern bir akıllı telefonla birlikte, çoğu günlük tarama ve metin tanıma görevleri için güçlü OCR uygulamaları oluşturmanıza olanak tanır. En gelişmiş görüntü işleme ve belge yapısı analizi, karmaşık matematiksel algoritmalar, sinir ağları ve diğer teknik karmaşıklıklardan ziyade işletmeye odaklanmanızı sağlayan birkaç kod satırında gerçekleştirilir.

Fotoğraf OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Taramadan aranabilir bir PDF oluşturun

PDF, özellikle birden fazla sayfayı tek bir dosyada birleştirme yeteneği nedeniyle kağıt belgeleri taramak için en popüler formatlardan biridir. Bu format, sözleşmeler, faturalar, yasal belgeler, pasaportlar ve kimlik kartları ve bireyler, işletmeler, bankalar ve devlet kurumları arasındaki diğer birçok belge için yaygın olarak kullanılmaktadır. Bununla birlikte, taranan herhangi bir PDF aslında bir görüntü koleksiyonudur. Makine tarafından okunabilen metin içermez, böylece kullanıcılar belge içeriğini arayamaz, kopyalayamaz veya başka bir şekilde değiştiremez.

aspose .NET OCR size taranan PDF’yi tamamen aranabilir ve endekslenebilir bir belgeye dönüştürmek için hızlı, kolay ve son derece güvenilir bir yol sunar. Sayfa içeriğini doğru bir şekilde tanır, onu metin-konuşma yazılımı tarafından seçilebilen, kopyalanabilen, okunabilen ve hatta çevirmenler, özetleyiciler ve diğer AI destekli analitik araçları tarafından otomatik olarak işlenebilen orijinal görüntü üzerinden makine tarafından okunabilir bir metin katmanına dönüştürür.

PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Resimlerde metin arayın

Dijital arşivler, özellikle büyük kuruluşlarda, çoğu zaman çok sayfalı belgeler içerebilen geniş bir tarama ve fotoğraf koleksiyonundan oluşur. Bu tür arşivlerin verimli yönetimi ve organizasyonu kolay bilgi alma ve navigasyon için etkilidir. Ancak, görüntüler makine tarafından okunabilir metin içermez, bu da belge içeriğini aramayı ve analiz etmeyi imkansız hale getirir.

C# OCR kitaplığı, yazı tipi, metin boyutu, stil ve diğer parametrelere bakılmaksızın görüntülerde kolayca metin aramanızı sağlar. Kütüphane ayrıca, çeşitli uygulamalarda ve endüstrilerde son derece yararlı olan vakalara duyarlı olmayan aramaları ve düzenli ifadeleri desteklemektedir. Bu işlevsellik, metinde bulunan içeriğe, anahtar kelimelere veya kalıplara göre belgelerin kategorize edilmesi için kullanılabilir; Anlaşmalar ve sözleşmeler dahilinde belirli şartlar veya maddeler aramak; İçlerinde bulunan anahtar kelimelere veya içeriğe dayalı olarak dosyaları yeniden düzenlemek; Belgeler içindeki kişisel verileri bulun ve tanımlayarak GDPR uyumluluğunu sağlamayı ve hassas bilgileri daha etkili bir şekilde yönetmeyi kolaylaştırır. Görüntülerle arama yapmak ayrıca, imzalı sözleşmeler ve faturalar aldıktan sonra otomatik iş akışları oluşturulmasına ve çeşitli iş süreçlerini kolaylaştırmaya olanak tanır.

Resimlerde metin arayın - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

LLM ile AI sonrası işlem

Artık ham tanımanın ötesine geçebilir ve OCR sonuçlarının metinsel kalitesini artırmak için AI güdümlü mantığı uygulayabilirsiniz. Büyük dil modelleri (LLM’ler) yazım hatalarını akıllıca düzeltebilir, kelime sınırlarını geri yükleyebilir, dilbilgisi kurallarını uygulayabilir ve metni bağlama göre uyarlayabilir-sözdizimi tabanlı yazım denetlerinin yapamayacağı bir şey.

Bu işlem sonrası adımı, düşük kaliteli taramalar, arka plan gürültüsü olan fotoğraflar veya çok dilli belgeler için idealdir. Temel metin girişini/çıkışını destekleyen herhangi bir LLM boru hattını takabilir veya üretime hazır sonuçlar elde etmek için Aspose’un yerleşik akıllı düzeltme araçlarını kullanabilirsiniz.

🧠ai LLM - C# ile işleme sonrası

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();