Aspose.OCR  for .NET

Konvertera bilder och PDF-filer till text i .NET

Lägg till optisk teckenigenkänning (OCR) till dina .NET-applikationer med några rader kod.

  Download Free Trial
  
 

Aspose.OCR för .NET är ett kraftfullt men ändå lättanvänt och kostnadseffektivt API för optisk teckenigenkänning. Med den kan du lägga till OCR-funktionalitet till dina .NET-applikationer på mindre än 5 rader kod utan att behöva oroa dig för komplex matematik, neurala nätverk och andra tekniska detaljer. Vår erfarenhet av maskininlärningsteknik och år av utveckling resulterade i en OCR-motor med överlägsen hastighet och noggrannhet som stöder 26 språk baserade på latinska och kyrilliska skrifter samt kinesiska . OCR API kan känna igen skannade bilder, smartphonefoton, skärmdumpar, bildområden och skannade PDF-filer och returnera resultat i de mest populära dokument- och datautbytesformaten. Olika förbehandlingsfilter låter dig känna igen roterade, sneda och brusiga bilder. Igenkänningsprestanda och systembelastning kan förbättras ytterligare genom att överföra resurskrävande beräkningsuppgifter till GPU :n.

Funktioner och funktioner i Aspose.OCR för .NET

Konverterar bilder och PDF-filer till text

Stöder alla bildformat du kan få från en skanner eller kamera

Läser språk baserade på latin och kyrilliska

Känner igen mer än 6 000 kinesiska tecken

Upptäcker och känner igen alla populära typsnitt

Bevarar noggrant teckensnittsstilar och formatering

Bearbetar endast hela bilden eller valda områden

Stöder roterade, sneda och brusiga bilder

Batchigenkänning av alla bilder i en mapp eller arkiv

Känner igen bilder som tillhandahålls som webblänkar

Hittar och korrigerar automatiskt felstavade ord

Fullt kompatibel med andra Aspose-produkter

Lätt att installera

Aspose.OCR för .NET distribueras som ett lätt NuGet-paket eller som en nedladdningsbar fil med minimala beroenden. Installera det helt enkelt i ditt projekt och du är redo att känna igen texter på alla språk som stöds och spara igenkänningsresultat i något av de format som stöds.

Begär en tillfällig licens för att börja bygga en fullt fungerande OCR-applikation utan några begränsningar och restriktioner.

Lätt att använda

Du behöver tre rader kod för att känna igen bilden och visa resultatet. Ja, så enkelt är det verkligen!

Bild till text i 3 rader - C#

// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Känn igen bild till text
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Visa igenkänningsresultatet
Console.WriteLine(result);

Cross-Plattform

Biblioteket stöder fullt ut .NET Standard 2.0. Det betyder att applikationerna kan köras på vilken plattform som helst: stationära Windows, Windows Server, macOS, Linux och moln.

26 igenkänningsspråk

OCR API kan känna igen ett stort antal språk och alla populära skriftskript, inklusive texter med blandade språk.

  • Utökat latinska alfabet : kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska.
  • Kyrilliska alfabetet : vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska.
  • Kinesiska : mer än 6 000 tecken.

Du kan lämna språkdetekteringen till biblioteket eller definiera språket själv för att öka igenkänningsprestandan och tillförlitligheten.

Känner igen foton

Det största hindret för OCR-applikationer är att skannrar inte är vanliga för slutanvändare. API:et har kraftfulla inbyggda bildförbehandlingsfilter som kan hantera roterade, sneda och brusiga bilder. I kombination med stöd för alla bildformat möjliggör det tillförlitlig igenkänning av även smartphonefoton. Det mesta av förbearbetningen och bildkorrigeringen sker automatiskt, så du behöver bara ingripa i svåra fall.

Tillämpa automatiska bildkorrigeringar - C#

// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Aktivera automatisk skevningsberäkning och kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Känner igen bilden
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Universalomvandlare

API:et kan läsa bokstavligen vilken bild du kan få från en skanner, kamera eller smartphone: PDF-dokument, JPEG, PNG, TIFF, GIF, BMP-bilder och till och med DjVu-filer. Flersidiga PDF-dokument, TIFF- och DjVu-bilder stöds fullt ut. Du kan också tillhandahålla en bild från webben via en URL.

Igenkänningsresultat returneras i de mest populära dokument- och datautbytesformaten: vanlig text, PDF, Microsoft Word, Microsoft Excel, JSON och XML.

Känn igen PDF och spara resultat till JSON - C#

// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Känner igen alla sidor från skannade PDF-filer
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Mata ut varje sida som JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Resursoptimering

Optisk teckenigenkänning är en resurskrävande process. API erbjuder mycket flexibla sätt att hitta en balans i den klassiska triaden av tid-pris-kvalitet:

  • Välj mellan grundlig igenkänning och snabb igenkänning.
  • Ange antalet trådar som tilldelats för igenkänning, eller låt biblioteket automatiskt skala till antalet processorkärnor.
  • Frigör CPU:n genom att ladda ner beräkningarna till GPU:n.

Snabb igenkänning - C#

// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Känn igen bilden i det snabbaste läget
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Stavnings kontroll

Även om OCR ger tillförlitliga resultat, kan damm och utskriftsdefekter göra att vissa symboler identifieras felaktigt. OCR API har en inbyggd stavningskontroll som automatiskt ersätter felstavade ord och befriar dig från att manuellt korrigera igenkänningsresultaten.

Resultat för stavningskontrolligenkänning - C#

// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Aktivera automatisk kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Känner igen bilden
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Rätta felstavade ord
string text =  result.GetSpellCheckCorrectedText();

Satsvis bearbetning

OCR API befriar dig från att känna igen varje bild en efter en genom att erbjuda olika batch-bearbetningsmetoder som låter dig känna igen flera bilder i ett samtal:

  • Igenkänning av flersidiga PDF-, TIFF- och DjVu-filer.
  • Igenkänning av alla filer i en mapp.
  • Igenkänning av alla filer i ett arkiv.
  • Igenkänning av alla filer från en lista.

Lär dig genom exempel

Aspose.OCR för .NET kommer med ett antal exempel skrivna i C# som gör att du snabbt kan bekanta dig med dess funktioner och möjligheter och ger dig en uppfattning om hur du skapar lösningar för dina affärsbehov.

  
  
  

Aspose erbjuder också inbyggda OCR API:er för andra populära programmeringsspråk: