Aspose.OCR  for .NET

Converteer afbeeldingen en PDF's naar tekst in .NET

Voeg optische tekenherkenning (OCR) toe aan uw .NET-toepassingen met een paar regels code.

  Download Free Trial
  
 

Aspose.OCR voor .NET is een krachtige maar gebruiksvriendelijke en kosteneffectieve API voor optische tekenherkenning. Hiermee kunt u OCR-functionaliteit aan uw .NET-toepassingen toevoegen in minder dan 5 regels code zonder u zorgen te maken over complexe wiskunde, neurale netwerken en andere technische details. Onze ervaring in machine learning-technologieën en jarenlange ontwikkeling hebben geresulteerd in een OCR-engine met superieure snelheid en nauwkeurigheid die 26 talen ondersteunt op basis van Latijnse en Cyrillische scripts, evenals Chinees . OCR API kan gescande afbeeldingen, smartphonefoto's, screenshots, delen van afbeeldingen en gescande PDF's herkennen en resultaten retourneren in de meest populaire document- en gegevensuitwisselingsformaten. Met verschillende voorbewerkingsfilters kunt u geroteerde, scheve en ruisrijke afbeeldingen herkennen. Herkenningsprestaties en systeembelasting kunnen verder worden verbeterd door resource-intensieve rekentaken over te dragen naar de GPU .

Functies en mogelijkheden van Aspose.OCR voor .NET

Converteert afbeeldingen en PDF's naar tekst

Ondersteunt alle beeldformaten die u kunt krijgen van een scanner of camera

Leest talen op basis van Latijn en Cyrillisch

Herkent meer dan 6.000 Chinese karakters

Detecteert en herkent alle populaire lettertypen

Bewaart lettertypestijlen en opmaak zorgvuldig

Verwerkt alleen de hele afbeelding of geselecteerde gebieden

Ondersteunt gedraaide, scheve afbeeldingen en afbeeldingen met ruis

Batchherkenning van alle afbeeldingen in een map of archief

Herkent afbeeldingen die worden aangeboden als weblinks

Vindt en corrigeert automatisch verkeerd gespelde woorden

Volledig compatibel met andere Aspose-producten

Makkelijk te installeren

Aspose.OCR voor .NET wordt gedistribueerd als een lichtgewicht NuGet-pakket of als een downloadbaar bestand met minimale afhankelijkheden. Installeer het gewoon in uw project en u bent klaar om teksten in alle ondersteunde talen te herkennen en herkenningsresultaten op te slaan in elk van de ondersteunde formaten.

Vraag een tijdelijke licentie aan om te beginnen met het bouwen van een volledig functionele OCR-applicatie zonder limieten en beperkingen.

Makkelijk te gebruiken

U hebt drie regels code nodig om de afbeelding te herkennen en het resultaat weer te geven. Ja, zo simpel is het echt!

Afbeelding naar tekst in 3 regels - C#

// OCR-engine initialiseren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Herken afbeelding naar tekst
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Geef het herkenningsresultaat weer
Console.WriteLine(result);

Platformoverschrijdend

De bibliotheek ondersteunt .NET Standard 2.0 volledig. Het betekent dat de applicaties op elk platform kunnen draaien: desktop Windows, Windows Server, macOS, Linux en cloud.

26 herkenningstalen

OCR API kan een groot aantal talen en alle populaire schrijfscripts herkennen, inclusief teksten met gemengde talen.

  • Uitgebreid Latijns alfabet : Kroatisch, Tsjechisch, Deens, Nederlands, Engels, Estisch, Fins, Frans, Duits, Italiaans, Lets, Litouws, Noors, Pools, Portugees, Roemeens, Slowaaks, Sloveens, Spaans, Zweeds.
  • Cyrillisch alfabet : Wit-Russisch, Bulgaars, Kazachs, Russisch, Servisch, Oekraïens.
  • Chinees : meer dan 6.000 karakters.

U kunt de taaldetectie overlaten aan de bibliotheek of de taal zelf definiëren om de herkenningsprestaties en betrouwbaarheid te verhogen.

Foto's herkennen

De grootste barrière voor OCR-toepassingen is dat scanners niet alledaags zijn voor eindgebruikers. De API heeft krachtige ingebouwde beeldvoorbewerkingsfilters die gedraaide, scheve en ruisrijke beelden aankunnen. In combinatie met ondersteuning voor alle beeldformaten zorgt het voor een betrouwbare herkenning van zelfs smartphonefoto's. De meeste voorbewerkingen en beeldcorrecties gebeuren automatisch, dus je hoeft alleen in moeilijke gevallen in te grijpen.

Automatische beeldcorrecties toepassen - C#

// OCR-engine initialiseren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Automatische berekening van scheefheid en contrast inschakelen
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Herken afbeelding
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Universele omvormer

De API kan letterlijk elke afbeelding lezen die u van een scanner, camera of smartphone kunt krijgen: PDF-documenten, JPEG-, PNG-, TIFF-, GIF-, BMP-afbeeldingen en zelfs DjVu-bestanden. PDF-documenten met meerdere pagina's, TIFF- en DjVu-afbeeldingen worden volledig ondersteund. U kunt ook een afbeelding van internet aanleveren via een URL.

Erkenningsresultaten worden geretourneerd in de meest populaire document- en gegevensuitwisselingsindelingen: platte tekst, PDF, Microsoft Word, Microsoft Excel, JSON en XML.

Herken PDF en sla de resultaten op in JSON - C#

// OCR-engine initialiseren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Herken alle pagina's van gescande PDF
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Voer elke pagina uit als JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Resource-optimalisatie

Optische karakterherkenning is een arbeidsintensief proces. De API biedt zeer flexibele manieren om een balans te vinden in de klassieke triade tijd-prijs-kwaliteit:

  • Kies tussen grondige herkenning en snelle herkenning.
  • Geef het aantal threads op dat is toegewezen voor herkenning of laat de bibliotheek automatisch schalen naar het aantal processorcores.
  • Maak de CPU vrij door de berekeningen naar de GPU te verplaatsen.

Snelle herkenning - C#

// OCR-engine initialiseren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Herken afbeelding in de snelste modus
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Spellingscontrole

Hoewel de OCR betrouwbare resultaten oplevert, kunnen stof- en afdrukfouten ertoe leiden dat sommige symbolen niet goed worden herkend. OCR API heeft een ingebouwde spellingcontrole die automatisch verkeerd gespelde woorden vervangt en u verlost van het handmatig corrigeren van de herkenningsresultaten.

Spellingcontrole herkenningsresultaten - C#

// OCR-engine initialiseren
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Automatisch contrast inschakelen
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Herken afbeelding
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Corrigeer verkeerd gespelde woorden
string text =  result.GetSpellCheckCorrectedText();

Batchverwerking

OCR API bevrijdt u van het één voor één herkennen van elke afbeelding door verschillende batchverwerkingsmethoden aan te bieden waarmee u meerdere afbeeldingen in één aanroep kunt herkennen:

  • Herkenning van PDF-, TIFF- en DjVu-bestanden met meerdere pagina's.
  • Herkenning van alle bestanden in een map.
  • Herkenning van alle bestanden in een archief.
  • Herkenning van alle bestanden uit een lijst.

Leer door voorbeeld

Aspose.OCR voor .NET wordt geleverd met een aantal voorbeelden geschreven in C# waarmee u snel vertrouwd raakt met de functies en mogelijkheden en u een idee krijgt van het creëren van oplossingen voor uw zakelijke behoeften.

  
  

Aspose biedt ook native OCR API's voor andere populaire programmeertalen: