Aspose.OCR  for C++

Converteer afbeeldingen en PDF's naar tekst in C++

Voeg optische tekenherkenning (OCR) toe aan uw C++-toepassingen met een paar regels code.

  Download Free Trial
  
 

Aspose.OCR voor C++ breidt uw toepassingen uit met optische tekenherkenningsmogelijkheden in 5 regels code. Onze ervaring met neurale netwerken en machine learning is vertaald in een OCR-bibliotheek met superieure prestaties en nauwkeurigheid die 26 talen ondersteunt op basis van Latijnse en Cyrillische scripts en Chinees . OCR API kan gescande afbeeldingen, smartphonefoto's, screenshots, delen van afbeeldingen en gescande PDF's herkennen en resultaten retourneren in de meest populaire document- en gegevensuitwisselingsformaten. Het is volledig offline en vereist geen internetverbinding om te werken. De API vereist minimale inspanning om aan de slag te gaan en een ondiepe leercurve om onder de knie te krijgen. Alle pre-processing, scheefheidcorrectie, ruisverwijdering, taaldetectie, multi-threading en andere complexe taken worden automatisch uitgevoerd, maar kunnen worden aangepast om harde gevallen aan te pakken.

Geavanceerde C++ OCR API-functies

Extraheert tekst uit afbeeldingen en maakt doorzoekbare PDF's

Ondersteunt elke afbeelding die u kunt krijgen van een scanner of camera

Leest uitgebreide Latijnse en Cyrillische schriften

Herkent meer dan 6.000 Chinese karakters

Detecteert en herkent alle populaire lettertypen en opmaak

Bewerkt afbeeldingen voor herkenning

Verwerkt alleen de hele afbeelding of geselecteerde gebieden

Ondersteunt gedraaide, scheve afbeeldingen en afbeeldingen met ruis

Batchherkenning van alle afbeeldingen in een map of archief

Herkent afbeeldingen die worden aangeboden als weblinks

Vindt en corrigeert automatisch verkeerd gespelde woorden

Herkenningsresultaat ophalen als JSON

Makkelijk te gebruiken

Denk je nog steeds dat C++ OCR moeilijk is? Met onze bibliotheek heeft u slechts 5 regels code nodig om de afbeelding te herkennen en het resultaat weer te geven. Probeer deze code en ontdek het zelf:

Afbeelding naar tekst in 5 regels - C++

// Geef afbeeldingspad op
std::string image_path = "../Data/Source/sample.png";

// Buffer voorbereiden op resultaat
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Doe de magie
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Geef het herkenningsresultaat weer
std::wcout << buffer << L"\n";

26 herkenningstalen

OCR API kan een groot aantal talen en alle populaire schrijfscripts herkennen, inclusief teksten met gemengde talen.

  • Uitgebreid Latijns alfabet : Kroatisch, Tsjechisch, Deens, Nederlands, Engels, Estisch, Fins, Frans, Duits, Italiaans, Lets, Litouws, Noors, Pools, Portugees, Roemeens, Slowaaks, Sloveens, Spaans, Zweeds.
  • Cyrillisch alfabet : Wit-Russisch, Bulgaars, Kazachs, Russisch, Servisch, Oekraïens.
  • Chinees : meer dan 6.000 karakters.

U kunt de taaldetectie overlaten aan de bibliotheek of de taal zelf definiëren om de herkenningsprestaties en betrouwbaarheid te verhogen.

Batchverwerking

OCR API bevrijdt u van het één voor één herkennen van elke afbeelding door verschillende batchverwerkingsmethoden aan te bieden waarmee u meerdere afbeeldingen in één aanroep kunt herkennen:

  • Herkenning van PDF- en TIFF-bestanden met meerdere pagina's.
  • Herkenning van alle bestanden in een map.
  • Herkenning van alle bestanden in een archief.

ZIP-archief herkennen - C++

// Archiefpad opgeven
std::string archive_path = "book.zip";

// Buffer voorbereiden op resultaat
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Initialiseer RecognitionSettings-object met standaardwaarden
RecognitionSettings settings;

// Herken
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Opmaak behouden

De OCR-bibliotheek leest alle populaire lettertypen zoals Arial, Times New Roman, Courier New, Tahoma, Calibri en meer in normale, vetgedrukte en cursieve stijlen en behoudt zorgvuldig de opmaak in OCR-resultaten. U kunt herkenningsresultaten ook in regels splitsen en tekstgebieden op een pagina detecteren.

Foto's herkennen

De wijdverbreide acceptatie van OCR-toepassingen wordt meestal tegengehouden door het feit dat scanners voor de meeste gebruikers niet alledaags zijn. Onze OCR-bibliotheek heeft krachtige ingebouwde beeldvoorbewerkingsfilters die donkere, geroteerde, scheve en ruisrijke beelden aankunnen. In combinatie met ondersteuning voor alle beeldformaten zorgt het voor een betrouwbare herkenning van zelfs smartphonefoto's. De meeste voorbewerkingen en beeldcorrecties gebeuren automatisch, dus je hoeft alleen in moeilijke gevallen in te grijpen.

Aangepaste hoek instellen voor scheefstandcorrectie - C++

// Originele afbeelding
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Buffer voorbereiden op resultaat
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Schuine hoek aanpassen:
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Herken afbeelding
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Spellingscontrole

Hoewel de OCR betrouwbare resultaten oplevert, kunnen stof- en afdrukfouten ertoe leiden dat sommige symbolen niet goed worden herkend. OCR API heeft een ingebouwde spellingcontrole die automatisch verkeerd gespelde woorden vervangt en u verlost van het handmatig corrigeren van de herkenningsresultaten.

  
  

Aspose biedt ook native OCR API&#39;s voor andere populaire programmeertalen: