Aspose.OCR  for .NET

Converti immagini e PDF in testo in .NET

Aggiungi il riconoscimento ottico dei caratteri (OCR) alle tue applicazioni .NET con poche righe di codice.

  Download Free Trial
  
 

Aspose.OCR per .NET è un'API potente ma facile da usare ed economica per il riconoscimento ottico dei caratteri. Con esso, puoi aggiungere funzionalità OCR alle tue applicazioni .NET in meno di 5 righe di codice senza preoccuparti di matematica complessa, reti neurali e altri dettagli tecnici. La nostra esperienza nelle tecnologie di apprendimento automatico e anni di sviluppo hanno portato a un motore OCR con velocità e precisione superiori che supporta 26 lingue basate su caratteri latini e cirillici oltre al cinese . L'API OCR è in grado di riconoscere immagini scansionate, foto di smartphone, schermate, aree di immagini e PDF scansionati e restituire risultati nei formati di scambio di dati e documenti più diffusi. Vari filtri di pre-elaborazione consentono di riconoscere immagini ruotate, inclinate e rumorose. Le prestazioni di riconoscimento e il carico del sistema possono essere ulteriormente migliorati trasferendo alla GPU attività di calcolo ad alta intensità di risorse.

Caratteristiche e funzionalità di Aspose.OCR per .NET

Converte immagini e PDF in testo

Supporta tutti i formati di immagine che puoi ottenere da uno scanner o da una fotocamera

Legge lingue basate sul latino e sul cirillico

Riconosce più di 6.000 caratteri cinesi

Rileva e riconosce tutti i caratteri tipografici più diffusi

Conserva con cura gli stili dei caratteri e la formattazione

Elabora l'intera immagine o solo le aree selezionate

Supporta immagini ruotate, oblique e rumorose

Riconoscimento in batch di tutte le immagini in una cartella o in un archivio

Riconosce le immagini fornite come collegamenti web

Trova e corregge automaticamente le parole errate

Pienamente compatibile con altri prodotti Aspose

Facile da installare

Aspose.OCR per .NET viene distribuito come pacchetto NuGet leggero o come file scaricabile con dipendenze minime. Installalo semplicemente sul tuo progetto e sei pronto per riconoscere i testi in qualsiasi lingua supportata e salvare i risultati del riconoscimento in qualsiasi formato supportato.

Richiedi una licenza temporanea per iniziare a creare un'applicazione OCR completamente funzionante senza limiti e restrizioni.

Facile da usare

Sono necessarie tre righe di codice per riconoscere l'immagine e visualizzare il risultato. Si, e davvero cosi semplice!

Da immagine a testo in 3 righe - C#

// Inizializza il motore OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Riconosci l'immagine nel testo
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Visualizza il risultato del riconoscimento
Console.WriteLine(result);

Multipiattaforma

La libreria supporta completamente .NET Standard 2.0. Significa che le applicazioni possono essere eseguite su qualsiasi piattaforma: desktop Windows, Windows Server, macOS, Linux e cloud.

26 Lingue di riconoscimento

L'API OCR è in grado di riconoscere un gran numero di lingue e tutti gli script di scrittura più diffusi, compresi i testi con lingue miste.

  • Alfabeto latino esteso : croato, ceco, danese, olandese, inglese, estone, finlandese, francese, tedesco, italiano, lettone, lituano, norvegese, polacco, portoghese, rumeno, slovacco, sloveno, spagnolo, svedese.
  • Alfabeto cirillico : bielorusso, bulgaro, kazako, russo, serbo, ucraino.
  • Cinese : più di 6.000 caratteri.

Puoi lasciare il rilevamento della lingua alla libreria o definire tu stesso la lingua per aumentare le prestazioni e l'affidabilità del riconoscimento.

Riconosci le foto

Il più grande ostacolo alle applicazioni OCR è che gli scanner non sono comuni per gli utenti finali. L'API dispone di potenti filtri di pre-elaborazione delle immagini integrati in grado di gestire immagini ruotate, inclinate e rumorose. In combinazione con il supporto per tutti i formati di immagine, consente il riconoscimento affidabile anche delle foto dello smartphone. La maggior parte della pre-elaborazione e correzione dell'immagine viene eseguita automaticamente, quindi dovrai intervenire solo nei casi difficili.

Applica correzioni automatiche dell'immagine - C#

// Inizializza il motore OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Abilita il calcolo automatico dell'inclinazione e il contrasto
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Riconosci l'immagine
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Convertitore universale

L'API può leggere letteralmente qualsiasi immagine che puoi ottenere da uno scanner, una fotocamera o uno smartphone: documenti PDF, JPEG, PNG, TIFF, GIF, immagini BMP e persino file DjVu. I documenti PDF multipagina, le immagini TIFF e DjVu sono completamente supportati. Puoi anche fornire un'immagine dal Web tramite un URL.

I risultati del riconoscimento vengono restituiti nei formati di scambio di dati e documenti più diffusi: testo normale, PDF, Microsoft Word, Microsoft Excel, JSON e XML.

Riconosci PDF e salva i risultati in JSON - C#

// Inizializza il motore OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Riconosci tutte le pagine del PDF scansionato
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Output di ogni pagina come JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Ottimizzazione delle risorse

Il riconoscimento ottico dei caratteri è un processo che richiede molte risorse. L'API offre modi molto flessibili per trovare un equilibrio nella classica triade tempo-prezzo-qualità:

  • Scegli tra riconoscimento completo e riconoscimento rapido.
  • Specificare il numero di thread allocati per il riconoscimento o consentire alla libreria di ridimensionarsi automaticamente in base al numero di core del processore.
  • Libera la CPU scaricando i calcoli sulla GPU.

Riconoscimento veloce - C#

// Inizializza il motore OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Riconosci l'immagine nella modalità più veloce
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Controllo ortografico

Sebbene l'OCR produca risultati affidabili, polvere e difetti di stampa potrebbero causare il riconoscimento errato di alcuni simboli. L'API OCR ha un correttore ortografico integrato che sostituisce automaticamente le parole errate e ti libera dal dover correggere manualmente i risultati del riconoscimento.

Risultati del riconoscimento del controllo ortografico - C#

// Inizializza il motore OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Abilita contrasto automatico
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Riconosci l'immagine
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Correggere le parole errate
string text =  result.GetSpellCheckCorrectedText();

Elaborazione in lotti

L'API OCR ti libera dal riconoscere ogni immagine una per una offrendo vari metodi di elaborazione batch che ti consentono di riconoscere più immagini in una chiamata:

  • Riconoscimento di file PDF, TIFF e DjVu multipagina.
  • Riconoscimento di tutti i file in una cartella.
  • Riconoscimento di tutti i file in un archivio.
  • Riconoscimento di tutti i file da un elenco.

Impara con l'esempio

Aspose.OCR per .NET viene fornito con una serie di esempi scritti in C# che consentono di familiarizzare rapidamente con le sue funzioni e capacità e di fornire un'idea della creazione di soluzioni per le proprie esigenze aziendali.

  

Support and Learning Resources

  
  

Aspose offre anche API OCR native per altri linguaggi di programmazione popolari: