Converti immagini e PDF in testo in C++

Aggiungi il riconoscimento ottico dei caratteri (OCR) alle tue applicazioni C++ con poche righe di codice.

Aspose.OCR per C++ estende le tue applicazioni con capacità di riconoscimento ottico dei caratteri in 5 righe di codice. La nostra esperienza nelle reti neurali e nell'apprendimento automatico è stata tradotta in una libreria OCR con prestazioni e precisione superiori che supporta 26 lingue basate su script latino e cirillico oltre al cinese . L'API OCR è in grado di riconoscere immagini scansionate, foto di smartphone, schermate, aree di immagini e PDF scansionati e restituire risultati nei formati di scambio di dati e documenti più diffusi. È completamente offline e non richiede una connessione a Internet per funzionare. L'API richiede uno sforzo minimo per iniziare e una curva di apprendimento superficiale da padroneggiare. Tutte le attività di pre-elaborazione, correzione dell'inclinazione, rimozione del rumore, rilevamento della lingua, multi-threading e altre complesse vengono eseguite automaticamente, ma possono essere ottimizzate per gestire casi difficili.

A prima vista

Un breve riassunto delle capacità di riconoscimento ottico dei caratteri.

Caratteristiche principali

Estrai il testo dalle foto
Crea PDF ricercabili
Correzioni automatiche dell'immagine
Supporta più caratteri tipografici
Mantieni la formattazione del testo
Rileva frammenti di testo
Elaborazione in lotti
Controllo ortografico

Lingue supportate

lingua inglese
lingua cinese
lingua tedesca
lingua francese
lingua italiana
lingua spagnola
lingua russa
lingua ceca
lingua polacca
lingua ucraina
lingua tedesca
lingua estone
e più di 10

Aspose.OCR

Indipendenza dalla piattaforma

La libreria OCR supporta completamente le applicazioni C++ sia per Windows che per Linux.

Windows 64 bit

Linux 64 bit

Aspose.OCR

Formati di file supportati

Converti qualsiasi file che ottieni da uno scanner o da una fotocamera nei formati di scambio di dati e documenti più diffusi.

File sorgenti

PDF
JPEG
PNG
TIFF
BMP

Risultati del riconoscimento

PDF ricercabile
Microsoft Word
Microsoft Excel
Testo normale
JSON
XML

Aspose.OCR

Funzionalità avanzate dell'API OCR C++

Estrae il testo dalle immagini e crea PDF ricercabili

Supporta qualsiasi immagine che puoi ottenere da uno scanner o da una fotocamera

Legge gli script latini e cirillici estesi

Riconosce oltre 6.000 caratteri cinesi

Rileva e riconosce tutti i caratteri tipografici e la formattazione più diffusi

Pre-elabora le immagini prima del riconoscimento

Elabora l'intera immagine o solo le aree selezionate

Supporta immagini ruotate, oblique e rumorose

Riconoscimento in batch di tutte le immagini in una cartella o in un archivio

Riconosce le immagini fornite come collegamenti web

Trova e corregge automaticamente le parole errate

Ottieni il risultato del riconoscimento come JSON

Facile da usare

Pensi ancora che C++ OCR sia difficile? Con la nostra libreria, sono necessarie solo 5 righe di codice per riconoscere l'immagine e visualizzare il risultato. Prova questo codice e guarda di persona:

Da immagine a testo in 5 righe - C++

// Fornisci il percorso dell'immagine
std::string image_path = "../Data/Source/sample.png";

// Preparare il buffer per il risultato
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Fai la magia
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Visualizza il risultato del riconoscimento
std::wcout << buffer << L"\n";

26 Lingue di riconoscimento

L'API OCR è in grado di riconoscere un gran numero di lingue e tutti gli script di scrittura più diffusi, compresi i testi con lingue miste.

Alfabeto latino esteso : croato, ceco, danese, olandese, inglese, estone, finlandese, francese, tedesco, italiano, lettone, lituano, norvegese, polacco, portoghese, rumeno, slovacco, sloveno, spagnolo, svedese.
Alfabeto cirillico : bielorusso, bulgaro, kazako, russo, serbo, ucraino.
Cinese : più di 6.000 caratteri.

Puoi lasciare il rilevamento della lingua alla libreria o definire tu stesso la lingua per aumentare le prestazioni e l'affidabilità del riconoscimento.

Elaborazione in lotti

L'API OCR ti libera dal riconoscere ogni immagine una per una offrendo vari metodi di elaborazione batch che ti consentono di riconoscere più immagini in una chiamata:

Riconoscimento di file PDF e TIFF multipagina.
Riconoscimento di tutti i file in una cartella.
Riconoscimento di tutti i file in un archivio.

Riconosci l'archivio ZIP - C++

// Fornisci il percorso dell'archivio
std::string archive_path = "book.zip";

// Preparare il buffer per il risultato
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Inizializza l'oggetto RecognitionSettings con i valori predefiniti
RecognitionSettings settings;

// Riconoscere
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Conserva formattazione

La libreria OCR legge tutti i caratteri tipografici più diffusi come Arial, Times New Roman, Courier New, Tahoma, Calibri e altri in stili regolari, grassetto e corsivo e conserva accuratamente la formattazione nei risultati OCR. Puoi anche dividere i risultati del riconoscimento in linee e rilevare aree di testo in una pagina.

Riconosci le foto

L'adozione diffusa delle applicazioni OCR è solitamente interrotta dal fatto che gli scanner non sono comuni per la maggior parte degli utenti. La nostra libreria OCR dispone di potenti filtri di pre-elaborazione delle immagini integrati in grado di gestire immagini scure, ruotate, distorte e rumorose. In combinazione con il supporto per tutti i formati di immagine, consente il riconoscimento affidabile anche delle foto dello smartphone. La maggior parte della pre-elaborazione e correzione dell'immagine viene eseguita automaticamente, quindi dovrai intervenire solo nei casi difficili.

Imposta l'angolo personalizzato per la correzione dell'inclinazione - C++

// Immagine originale
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Preparare il buffer per il risultato
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Regola l'angolo di inclinazione
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Riconosci l'immagine
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Controllo ortografico

Sebbene l'OCR produca risultati affidabili, polvere e difetti di stampa potrebbero causare il riconoscimento errato di alcuni simboli. L'API OCR ha un correttore ortografico integrato che sostituisce automaticamente le parole errate e ti libera dal dover correggere manualmente i risultati del riconoscimento.

Support and Learning Resources

Perché Aspose.OCR per C++?
Elenco clienti
Storie di successo

Download Free Trial Pricing Information

Aspose offre anche API OCR native per altri linguaggi di programmazione popolari:

Converti immagini e PDF in testo in C++

Aggiungi il riconoscimento ottico dei caratteri (OCR) alle tue applicazioni C++ con poche righe di codice.

Aspose.OCR for C++

Overview

A prima vista

Indipendenza dalla piattaforma

Formati di file supportati

Funzionalità avanzate dell'API OCR C++

Facile da usare

Da immagine a testo in 5 righe - C++

26 Lingue di riconoscimento

Elaborazione in lotti

Riconosci l'archivio ZIP - C++

Conserva formattazione

Riconosci le foto

Imposta l'angolo personalizzato per la correzione dell'inclinazione - C++

Controllo ortografico

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forJava