Konvertera bilder och PDF-filer till text i .NET
Lägg till optisk teckenigenkänning (OCR) till dina .NET-applikationer med några rader kod.
Download Free TrialAspose.OCR för .NET är ett kraftfullt men ändå lättanvänt och kostnadseffektivt API för optisk teckenigenkänning. Med den kan du lägga till OCR-funktionalitet till dina .NET-applikationer på mindre än 5 rader kod utan att behöva oroa dig för komplex matematik, neurala nätverk och andra tekniska detaljer. Vår erfarenhet av maskininlärningsteknik och år av utveckling resulterade i en OCR-motor med överlägsen hastighet och noggrannhet som stöder 26 språk baserade på latinska och kyrilliska skrifter samt kinesiska . OCR API kan känna igen skannade bilder, smartphonefoton, skärmdumpar, bildområden och skannade PDF-filer och returnera resultat i de mest populära dokument- och datautbytesformaten. Olika förbehandlingsfilter låter dig känna igen roterade, sneda och brusiga bilder. Igenkänningsprestanda och systembelastning kan förbättras ytterligare genom att överföra resurskrävande beräkningsuppgifter till GPU :n.
Funktioner och funktioner i Aspose.OCR för .NET
Konverterar bilder och PDF-filer till text
Stöder alla bildformat du kan få från en skanner eller kamera
Läser språk baserade på latin och kyrilliska
Känner igen mer än 6 000 kinesiska tecken
Upptäcker och känner igen alla populära typsnitt
Bevarar noggrant teckensnittsstilar och formatering
Bearbetar endast hela bilden eller valda områden
Stöder roterade, sneda och brusiga bilder
Batchigenkänning av alla bilder i en mapp eller arkiv
Känner igen bilder som tillhandahålls som webblänkar
Hittar och korrigerar automatiskt felstavade ord
Fullt kompatibel med andra Aspose-produkter
Lätt att installera
Aspose.OCR för .NET distribueras som ett lätt NuGet-paket eller som en nedladdningsbar fil med minimala beroenden. Installera det helt enkelt i ditt projekt och du är redo att känna igen texter på alla språk som stöds och spara igenkänningsresultat i något av de format som stöds.
Begär en tillfällig licens för att börja bygga en fullt fungerande OCR-applikation utan några begränsningar och restriktioner.
Lätt att använda
Du behöver tre rader kod för att känna igen bilden och visa resultatet. Ja, så enkelt är det verkligen!
Bild till text i 3 rader - C#
// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Känn igen bild till text
string result = recognitionEngine.RecognizeImage("sample.jpg");
// Visa igenkänningsresultatet
Console.WriteLine(result);
Cross-Plattform
Biblioteket stöder fullt ut .NET Standard 2.0. Det betyder att applikationerna kan köras på vilken plattform som helst: stationära Windows, Windows Server, macOS, Linux och moln.
26 igenkänningsspråk
OCR API kan känna igen ett stort antal språk och alla populära skriftskript, inklusive texter med blandade språk.
- Utökat latinska alfabet : kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska.
- Kyrilliska alfabetet : vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska.
- Kinesiska : mer än 6 000 tecken.
Du kan lämna språkdetekteringen till biblioteket eller definiera språket själv för att öka igenkänningsprestandan och tillförlitligheten.
Känner igen foton
Det största hindret för OCR-applikationer är att skannrar inte är vanliga för slutanvändare. API:et har kraftfulla inbyggda bildförbehandlingsfilter som kan hantera roterade, sneda och brusiga bilder. I kombination med stöd för alla bildformat möjliggör det tillförlitlig igenkänning av även smartphonefoton. Det mesta av förbearbetningen och bildkorrigeringen sker automatiskt, så du behöver bara ingripa i svåra fall.
Tillämpa automatiska bildkorrigeringar - C#
// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Aktivera automatisk skevningsberäkning och kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true,
AutoSkew = true
};
// Känner igen bilden
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);
Universalomvandlare
API:et kan läsa bokstavligen vilken bild du kan få från en skanner, kamera eller smartphone: PDF-dokument, JPEG, PNG, TIFF, GIF, BMP-bilder och till och med DjVu-filer. Flersidiga PDF-dokument, TIFF- och DjVu-bilder stöds fullt ut. Du kan också tillhandahålla en bild från webben via en URL.
Igenkänningsresultat returneras i de mest populära dokument- och datautbytesformaten: vanlig text, PDF, Microsoft Word, Microsoft Excel, JSON och XML.
Känn igen PDF och spara resultat till JSON - C#
// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Känner igen alla sidor från skannade PDF-filer
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());
// Mata ut varje sida som JSON
foreach(var page in pages)
{
Console.WriteLine(page.GetJson());
}
Resursoptimering
Optisk teckenigenkänning är en resurskrävande process. API erbjuder mycket flexibla sätt att hitta en balans i den klassiska triaden av tid-pris-kvalitet:
- Välj mellan grundlig igenkänning och snabb igenkänning.
- Ange antalet trådar som tilldelats för igenkänning, eller låt biblioteket automatiskt skala till antalet processorkärnor.
- Frigör CPU:n genom att ladda ner beräkningarna till GPU:n.
Snabb igenkänning - C#
// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Känn igen bilden i det snabbaste läget
string result = recognitionEngine.RecognizeImageFast("sample.jpg");
Stavnings kontroll
Även om OCR ger tillförlitliga resultat, kan damm och utskriftsdefekter göra att vissa symboler identifieras felaktigt. OCR API har en inbyggd stavningskontroll som automatiskt ersätter felstavade ord och befriar dig från att manuellt korrigera igenkänningsresultaten.
Resultat för stavningskontrolligenkänning - C#
// Initiera OCR-motorn
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Aktivera automatisk kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true
};
// Känner igen bilden
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);
// Rätta felstavade ord
string text = result.GetSpellCheckCorrectedText();
Satsvis bearbetning
OCR API befriar dig från att känna igen varje bild en efter en genom att erbjuda olika batch-bearbetningsmetoder som låter dig känna igen flera bilder i ett samtal:
- Igenkänning av flersidiga PDF-, TIFF- och DjVu-filer.
- Igenkänning av alla filer i en mapp.
- Igenkänning av alla filer i ett arkiv.
- Igenkänning av alla filer från en lista.
Lär dig genom exempel
Aspose.OCR för .NET kommer med ett antal exempel skrivna i C# som gör att du snabbt kan bekanta dig med dess funktioner och möjligheter och ger dig en uppfattning om hur du skapar lösningar för dina affärsbehov.
Support and Learning Resources
- Produktsupport
- Gratis support
- Betald support
- Blogg
- Release Notes
- Varför Aspose.OCR för .NET?
- Kundlista
- Framgångsberättelser