Varför Aspose.OCR för .NET?

Aspose.OCR för .NET är ett robust, utvecklarvänligt och kostnadseffektivt API för optisk teckenigenkänning. På mindre än 10 rader inbyggd C#-kod kan du bygga in OCR-funktioner i dina .NET-skrivbordslösningar, MVC-baserade webbapplikationer, molntjänster och serverlösa Azure-funktioner. Extrahera maskinläsbar text från skanningar, foton och skärmdumpar, konvertera skannade sidor till sökbara och indexerbara PDF-filer, hitta och jämför text på bilder som fokuserar på affärsuppgifter snarare än komplex matematik, neurala nätverk och andra tekniska krångligheter. Klicka på objekten nedan för att lära dig mer om våra funktioner och fördelar.

Illustration ocr

Globala applikationer

Känn igen texter på latinska, kyrilliska och asiatiska texter, inklusive mer än 6 000 kinesiska tecken och hindi.

Läs allt

Hämta text från vilken fil som helst som erhållits via en skanner eller kamera och bearbeta bilder direkt från webblänkar.

Pålitliga resultat

Uppnå hög igenkänningsnoggrannhet för alla bilder, inklusive de som är ofokuserade, roterade, förvrängda och brusiga.

Batchigenkänning

Bulk-igenkänn alla bilder från mappar och arkiv; läs flersidiga PDF-dokument och TIFF-bilder.

Layoutdetektering

Identifiera och kategorisera innehållsblock i bilder för att säkerställa korrekt ordning av extraherad text, oavsett layout.

Live-kodexempel

Optisk teckenigenkänning blir en trivial och okomplicerad uppgift med Aspose.OCR, även för utvecklare som är nya inom tekniken. Bara några rader kod räcker för att extrahera text från en bild och visa den på skärmen. Det är verkligen så enkelt - ge det ett försök.

Redo att känna igen Redo att känna igen Släpp en fil här eller klicka för att bläddra *

* Genom att ladda upp dina filer eller använda tjänsten godkänner du vår Villkor och Integritetspolicy.

Erkännande resultat
 

Konvertera bild till text

Fler exempel >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Plattformsoberoende

Aspose.OCR för .NET kan fungera på vilken plattform som helst som stöder .NET, .NET Core eller .NET Framework – oavsett om det är lokalt maskin, på webbservern eller i molnet.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Filformat som stöds

Aspose.OCR for .NET kan fungera med praktiskt taget alla fil du kan få från en skanner eller kamera. Igenkänningsresultat returneras i de mest populära fil- och datautbytesformaten som kan sparas, importeras till en databas eller analyseras i realtid.

Bilder

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Erkännande resultat

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Lämplig för vilket innehåll som helst

Noggrannheten och tillförlitligheten för textigenkänning är starkt beroende av kvaliteten på originalbilden. Aspose.OCR för .NET tillhandahåller ett omfattande utbud av både helautomatiska och manuella bildbehandlingsfilter som förbättrar en bild innan den skickas till OCR-motorn.

Kraftfull bildbehandling och anpassningsbara algoritmer för detektering av innehållsstruktur möjliggör textextraktion från praktiskt taget alla bilder, allt från högkvalitativa skanningar till gatufoton. Flera bearbetningsfilter kan appliceras på samma bild för att få bästa igenkänningskvalitet.

Resursoptimering

Aspose.OCR för .NET möjliggör en mycket flexibel balansering av igenkänningshastighet, kvalitet och resursutnyttjande för varje specifikt användningsfall:

  • Välj mellan grundlig igenkänning och snabb igenkänning.
  • Ange antalet trådar som tilldelats för igenkänning, eller låt biblioteket automatiskt skala till antalet processorkärnor.
  • Frigör CPU:n genom att ladda ner beräkningarna till GPU:n.

28 igenkänningsspråk

Aspose.OCR för .NET är en universell lösning för dokumentbehandling, datautvinning och digitalisering av innehåll på global nivå. Med stöd för ett brett spektrum av europeiska och asiatiska manus, är den väl anpassad för alla skala och vänder sig till både små och medelstora företag såväl som multinationella företag.

Du kan delegera språkdetektering till biblioteket eller manuellt specificera språket, vilket förbättrar igenkänningsprestanda och tillförlitlighet. Följande språk stöds:

  • Utökat latin alfabet: kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska;
  • kyrilliska alfabetet: vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska;
  • Över 6 000 kinesiska tecken;
  • Hindi.

Funktioner och möjligheter

Aspose.OCR för .NET extraherar automatiskt text från foton eller skannade bilder, vilket eliminerar behovet av manuell omskrivning av dokument.

Feature icon

Foto OCR

Extrahera text från smartphonefoton med noggrannhet på skanningsnivå.

Feature icon

Sökbar PDF

Konvertera vilken skanning som helst till ett helt sökbart och indexerbart dokument.

Feature icon

URL-igenkänning

Känn igen en bild från URL utan att ladda ner den lokalt.

Feature icon

Bulkigenkänning

Läs alla bilder från flersidiga dokument, mappar och arkiv.

Feature icon

Alla typsnitt och stilar

Identifiera och känna igen text i alla populära typsnitt och stilar.

Feature icon

Finjustera igenkänning

Justera varje OCR-parameter för bästa igenkänningsresultat.

Feature icon

Stavningskontroll

Förbättra resultaten genom att automatiskt korrigera felstavade ord.

Feature icon

Hitta text i bilder

Sök efter text eller reguljärt uttryck i en uppsättning bilder.

Feature icon

Jämför bildtexter

Jämför texter på två bilder, oavsett fall och layout.

Lätt att använda

Du behöver bara några rader kod för att konvertera bild till text, skapa en sökbar PDF, spara igenkänningsresultat till dokument och mycket mer. Utforska kodexemplen för att förstå hur du integrerar Aspose.OCR för .NET i dina lösningar.

Installation

Aspose.OCR för .NET distribueras som ett NuGet-paket eller som en [nedladdningsbar fil]( https://releases.aspose.com/ ocr/net/) med minimala beroenden. Paketet kan läggas till ditt projekt direkt från Microsoft Visual Studio. Installera det helt enkelt i ditt projekt och du är redo att extrahera text från bilder och spara igenkänningsresultat i något av de format som stöds. Om ditt system har en CUDA-kompatibel GPU kan du använda GPU-accelererad OCR-motor för att avsevärt öka igenkänningsprestandan.

Du kan börja använda Aspose.OCR för .NET direkt efter installationen med vissa restriktioner . En tillfällig licens tar bort alla begränsningar av testversionen i 30 dagar. Använd den för att börja bygga en fullt fungerande OCR-applikation och fatta det slutliga beslutet att köpa Aspose.OCR för .NET senare.

Extrahera text från ett foto

När människor vanligtvis tänker på OCR (Optical Character Recognition), är den första kopplingen ofta med en skanner som den primära fångstenheten. Denna förening har historiska skäl och är fortfarande utbredd i många sammanhang, vilket ger en konsekvent och kontrollerad miljö för att fånga tryckt text från fysiska dokument med oöverträffad kvalitet. En skanner är dock specialiserad utrustning som inte alltid finns till hands och som kräver en stationär arbetsstation för att fungera. Lyckligtvis erbjuder den moderna världen ett bekvämt alternativ till traditionella skannrar - en smartphonekamera. Framstegen inom smarttelefonkamerateknik säkerställer att även en nybörjarsmartphone ger tillräcklig kvalitet för att fånga OCR-förberedda dokument. Och det inbyggda minnet gör det enklare än någonsin att digitalisera stora mängder dokument, tidningar, böcker, gatuskyltar och annan text på språng. Allt du behöver är rätt teknik för att konvertera dessa foton till maskinläsbar text.

Aspose.OCR för .NET är speciellt utformad för att känna igen alla typer av bilder direkt och kan finjusteras ytterligare för att hantera även foton av låg kvalitet. I kombination med en modern smartphone kan du skapa kraftfulla OCR-applikationer för de flesta vardagliga skannings- och textigenkänningsuppgifter. Den mest avancerade bildbehandlingen och dokumentstrukturanalysen utförs i några rader kod, vilket gör att du kan fokusera på affärer snarare än komplexa matematiska algoritmer, neurala nätverk och andra tekniska krångligheter.

Foto OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Skapa en sökbar PDF från skanningen

PDF är ett av de mest populära formaten för att skanna pappersdokument, särskilt på grund av dess förmåga att kombinera flera sidor till en enda fil. Det här formatet används ofta för utbyte av kontrakt, fakturor, juridiska dokument, pass och ID-kort och många andra dokument mellan privatpersoner, företag, banker och statliga myndigheter. Men alla skannade PDF-filer är i huvudsak en samling bilder. Den innehåller inte maskinläsbar text, så användare kan inte söka, kopiera eller på annat sätt manipulera dokumentinnehållet.

Aspose.OCR för .NET erbjuder dig ett snabbt, enkelt och mycket tillförlitligt sätt att konvertera alla skannade PDF-filer till ett helt sökbart och indexerbart dokument. Den känner noggrant igen sidinnehåll och omvandlar det till ett maskinläsbart textlager över originalbilden som kan väljas, kopieras, läsas av text-till-tal-programvara och till och med automatiskt bearbetas av översättare, summerare och annan AI-driven analys verktyg.

Lägg till textöverlägg till PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Sök efter text i bilder

Digitala arkiv, särskilt i stora organisationer, består ofta av en stor samling skanningar och foton, av vilka många kan innehålla flersidiga dokument. Effektiv hantering och organisering av sådana arkiv är väsentligt för enkel informationssökning och navigering. Bilder innehåller dock inte maskinläsbar text, vilket gör det omöjligt att söka och analysera dokumentinnehåll.

Aspose.OCR för .NET låter dig enkelt söka efter text i bilder, oavsett teckensnitt, textstorlek, stil och andra parametrar. Biblioteket stöder även skiftlägesokänsliga sökningar och reguljära uttryck, som är extremt användbara i olika applikationer och branscher. Denna funktion kan användas för att kategorisera dokument baserat på innehåll, nyckelord eller mönster som finns i texten; söka efter specifika villkor eller klausuler i avtal och kontrakt; omorganisera filer baserat på nyckelord eller innehåll som finns i dem; lokalisera och identifiera personuppgifter i dokument, vilket gör det lättare att säkerställa efterlevnad av GDPR och hantera känslig information mer effektivt. Genom att söka i bilder kan du också skapa automatiserade arbetsflöden och effektivisera olika affärsprocesser när du får undertecknade kontrakt och fakturor.

Sök efter text i bilder - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}