Aspose.OCR  for C++

Konvertera bilder och PDF-filer till text i C++

Lägg till optisk teckenigenkänning (OCR) till dina C++-applikationer med några rader kod.

  Download Free Trial
  
 

Aspose.OCR för C++ utökar dina applikationer med funktioner för optisk teckenigenkänning i 5 rader kod. Vår erfarenhet av neurala nätverk och maskininlärning har översatts till ett OCR-bibliotek med överlägsen prestanda och noggrannhet som stöder 26 språk baserade på latinska och kyrilliska texter samt kinesiska . OCR API kan känna igen skannade bilder, smartphonefoton, skärmdumpar, bildområden och skannade PDF-filer och returnera resultat i de mest populära dokument- och datautbytesformaten. Det är helt offline och kräver ingen internetanslutning för att fungera. API:et kräver minimal ansträngning för att komma igång och en ytlig inlärningskurva att bemästra. All förbearbetning, skevningskorrigering, brusborttagning, språkdetektering, multi-threading och andra komplexa uppgifter utförs automatiskt, men kan ställas in för att hantera svåra fall.

Avancerade C++ OCR API-funktioner

Extraherar text från bilder och skapar sökbara PDF-filer

Stöder alla bilder du kan få från en skanner eller kamera

Läser utökade latinska och kyrilliska skrifter

Känner igen över 6 000 kinesiska tecken

Upptäcker och känner igen alla populära typsnitt och formatering

Förbehandlar bilder före igenkänning

Bearbetar endast hela bilden eller valda områden

Stöder roterade, sneda och brusiga bilder

Batchigenkänning av alla bilder i en mapp eller arkiv

Känner igen bilder som tillhandahålls som webblänkar

Hittar och korrigerar automatiskt felstavade ord

Få igenkänningsresultat som JSON

Lätt att använda

Tycker du fortfarande att C++ OCR är svårt? Med vårt bibliotek behöver du bara 5 rader kod för att känna igen bilden och visa resultatet. Prova den här koden och se själv:

Bild till text i 5 rader - C++

// Ange bildsökväg
std::string image_path = "../Data/Source/sample.png";

// Förbered buffert för resultat
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Gör magin
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Visa igenkänningsresultatet
std::wcout << buffer << L"\n";

26 igenkänningsspråk

OCR API kan känna igen ett stort antal språk och alla populära skriftskript, inklusive texter med blandade språk.

  • Utökat latinska alfabet : kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska.
  • Kyrilliska alfabetet : vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska.
  • Kinesiska : mer än 6 000 tecken.

Du kan lämna språkdetekteringen till biblioteket eller definiera språket själv för att öka igenkänningsprestandan och tillförlitligheten.

Satsvis bearbetning

OCR API befriar dig från att känna igen varje bild en efter en genom att erbjuda olika batch-bearbetningsmetoder som låter dig känna igen flera bilder i ett samtal:

  • Igenkänning av flersidiga PDF- och TIFF-filer.
  • Igenkänning av alla filer i en mapp.
  • Igenkänning av alla filer i ett arkiv.

Känn igen ZIP-arkiv - C++

// Ange arkivväg
std::string archive_path = "book.zip";

// Förbered buffert för resultat
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Initiera RecognitionSettings-objekt med standardvärden
RecognitionSettings settings;

// Känna igen
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Bevara formateringen

OCR-biblioteket läser alla populära typsnitt som Arial, Times New Roman, Courier New, Tahoma, Calibri och mer i vanliga, fetstilta och kursiv stilar och bevarar noggrant formateringen i OCR-resultat. Du kan också dela upp igenkänningsresultat i rader och upptäcka textområden på en sida.

Känner igen foton

Den utbredda användningen av OCR-applikationer stoppas vanligtvis av det faktum att skannrar inte är vanliga för de flesta användare. Vårt OCR-bibliotek har kraftfulla inbyggda bildförbehandlingsfilter som kan hantera mörka, roterade, sneda och brusiga bilder. I kombination med stöd för alla bildformat möjliggör det tillförlitlig igenkänning av även smartphonefoton. Det mesta av förbearbetningen och bildkorrigeringen sker automatiskt, så du behöver bara ingripa i svåra fall.

Ställ in anpassad vinkel för skevningskorrigering - C++

// Originalbild
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Förbered buffert för resultat
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Justera sned vinkel
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Känner igen bilden
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Stavnings kontroll

Även om OCR ger tillförlitliga resultat, kan damm och utskriftsdefekter göra att vissa symboler identifieras felaktigt. OCR API har en inbyggd stavningskontroll som automatiskt ersätter felstavade ord och befriar dig från att manuellt korrigera igenkänningsresultaten.

  
  
  

Aspose erbjuder också inbyggda OCR API:er för andra populära programmeringsspråk: