Aspose.OCR  for C++

Converti immagini e PDF in testo in C++

Aggiungi il riconoscimento ottico dei caratteri (OCR) alle tue applicazioni C++ con poche righe di codice.

  Download Free Trial
  
 

Aspose.OCR per C++ estende le tue applicazioni con capacità di riconoscimento ottico dei caratteri in 5 righe di codice. La nostra esperienza nelle reti neurali e nell'apprendimento automatico è stata tradotta in una libreria OCR con prestazioni e precisione superiori che supporta 26 lingue basate su script latino e cirillico oltre al cinese . L'API OCR è in grado di riconoscere immagini scansionate, foto di smartphone, schermate, aree di immagini e PDF scansionati e restituire risultati nei formati di scambio di dati e documenti più diffusi. È completamente offline e non richiede una connessione a Internet per funzionare. L'API richiede uno sforzo minimo per iniziare e una curva di apprendimento superficiale da padroneggiare. Tutte le attività di pre-elaborazione, correzione dell'inclinazione, rimozione del rumore, rilevamento della lingua, multi-threading e altre complesse vengono eseguite automaticamente, ma possono essere ottimizzate per gestire casi difficili.

Funzionalità avanzate dell'API OCR C++

Estrae il testo dalle immagini e crea PDF ricercabili

Supporta qualsiasi immagine che puoi ottenere da uno scanner o da una fotocamera

Legge gli script latini e cirillici estesi

Riconosce oltre 6.000 caratteri cinesi

Rileva e riconosce tutti i caratteri tipografici e la formattazione più diffusi

Pre-elabora le immagini prima del riconoscimento

Elabora l'intera immagine o solo le aree selezionate

Supporta immagini ruotate, oblique e rumorose

Riconoscimento in batch di tutte le immagini in una cartella o in un archivio

Riconosce le immagini fornite come collegamenti web

Trova e corregge automaticamente le parole errate

Ottieni il risultato del riconoscimento come JSON

Facile da usare

Pensi ancora che C++ OCR sia difficile? Con la nostra libreria, sono necessarie solo 5 righe di codice per riconoscere l'immagine e visualizzare il risultato. Prova questo codice e guarda di persona:

Da immagine a testo in 5 righe - C++

// Fornisci il percorso dell'immagine
std::string image_path = "../Data/Source/sample.png";

// Preparare il buffer per il risultato
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Fai la magia
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Visualizza il risultato del riconoscimento
std::wcout << buffer << L"\n";

26 Lingue di riconoscimento

L'API OCR è in grado di riconoscere un gran numero di lingue e tutti gli script di scrittura più diffusi, compresi i testi con lingue miste.

  • Alfabeto latino esteso : croato, ceco, danese, olandese, inglese, estone, finlandese, francese, tedesco, italiano, lettone, lituano, norvegese, polacco, portoghese, rumeno, slovacco, sloveno, spagnolo, svedese.
  • Alfabeto cirillico : bielorusso, bulgaro, kazako, russo, serbo, ucraino.
  • Cinese : più di 6.000 caratteri.

Puoi lasciare il rilevamento della lingua alla libreria o definire tu stesso la lingua per aumentare le prestazioni e l'affidabilità del riconoscimento.

Elaborazione in lotti

L'API OCR ti libera dal riconoscere ogni immagine una per una offrendo vari metodi di elaborazione batch che ti consentono di riconoscere più immagini in una chiamata:

  • Riconoscimento di file PDF e TIFF multipagina.
  • Riconoscimento di tutti i file in una cartella.
  • Riconoscimento di tutti i file in un archivio.

Riconosci l'archivio ZIP - C++

// Fornisci il percorso dell'archivio
std::string archive_path = "book.zip";

// Preparare il buffer per il risultato
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Inizializza l'oggetto RecognitionSettings con i valori predefiniti
RecognitionSettings settings;

// Riconoscere
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Conserva formattazione

La libreria OCR legge tutti i caratteri tipografici più diffusi come Arial, Times New Roman, Courier New, Tahoma, Calibri e altri in stili regolari, grassetto e corsivo e conserva accuratamente la formattazione nei risultati OCR. Puoi anche dividere i risultati del riconoscimento in linee e rilevare aree di testo in una pagina.

Riconosci le foto

L'adozione diffusa delle applicazioni OCR è solitamente interrotta dal fatto che gli scanner non sono comuni per la maggior parte degli utenti. La nostra libreria OCR dispone di potenti filtri di pre-elaborazione delle immagini integrati in grado di gestire immagini scure, ruotate, distorte e rumorose. In combinazione con il supporto per tutti i formati di immagine, consente il riconoscimento affidabile anche delle foto dello smartphone. La maggior parte della pre-elaborazione e correzione dell'immagine viene eseguita automaticamente, quindi dovrai intervenire solo nei casi difficili.

Imposta l'angolo personalizzato per la correzione dell'inclinazione - C++

// Immagine originale
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Preparare il buffer per il risultato
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Regola l'angolo di inclinazione
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Riconosci l'immagine
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Controllo ortografico

Sebbene l'OCR produca risultati affidabili, polvere e difetti di stampa potrebbero causare il riconoscimento errato di alcuni simboli. L'API OCR ha un correttore ortografico integrato che sostituisce automaticamente le parole errate e ti libera dal dover correggere manualmente i risultati del riconoscimento.

  

Support and Learning Resources

  
  

Aspose offre anche API OCR native per altri linguaggi di programmazione popolari: