Perché scegliere la libreria Aspose OCR?

Crea potenti funzionalità OCR nelle tue app .NET in pochi secondi. La nostra API OCR di facile utilizzo ti consente di estrarre testo da immagini e scansioni, creare PDF ricercabili e altro ancora con un codice C# minimo. Ideale per funzioni desktop .NET, Web, cloud e serverless. Fai clic sugli elementi seguenti per saperne di più sulle nostre funzionalità e vantaggi.

Illustration ocr

Applicazioni OCR globali

C# OCR riconosce testi in inglese, cirillico, arabo, persiano, cinese, giapponese, coreano, hindi, tamil e in lingue miste.

Leggi tutto

Ottieni testo da qualsiasi file ottenuto tramite uno scanner o una fotocamera ed elabora le immagini direttamente dai collegamenti web.

Risultati affidabili

Ottieni un'elevata precisione di riconoscimento per tutte le immagini, comprese quelle fuori fuoco, ruotate, distorte e rumorose.

Riconoscimento batch

Riconoscere in blocco tutte le immagini da cartelle e archivi; leggere documenti PDF multipagina e immagini TIFF.

Rilevamento del layout

Identifica e classifica i blocchi di contenuto nelle immagini per garantire l'ordine corretto del testo estratto, indipendentemente dal layout.

Esempio di codice in tempo reale

.NET OCR diventa un compito banale e diretto con l’API Aspose OCR, anche per i nuovi sviluppatori. Bastano poche righe di codice per estrarre il testo da un’immagine e visualizzarlo sullo schermo. È davvero così semplice: provalo.

Pronto a riconoscere Pronto a riconoscere Trascina un file qui o fai clic per sfogliare *

*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.

Risultato del riconoscimento
 

Converti immagine in testo

Altri esempi >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Indipendenza dalla piattaforma

La libreria OCR multipiattaforma può funzionare ovunque in .NET, .NET Core o .NET Framework, sia su un computer locale, sia su web server o nel cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formati di file supportati

Aspose.OCR for .NET può funzionare con qualsiasi file puoi ottenerlo da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.

Immagini

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR batch

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Risultati del riconoscimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Adatto a qualsiasi contenuto

L’accuratezza e l’affidabilità del riconoscimento del testo in C# dipendono in gran parte dalla qualità dell’immagine. .NET OCR offre una serie completa di ottimizzazione delle immagini automatizzata e manuale, garantendo risultati di riconoscimento superiori.

La potente elaborazione delle immagini, il rilevamento del testo completamente personalizzabile, la post-elaborazione e la correzione ortografica automatizzata consentono l’estrazione del testo da qualsiasi scansione o foto con la massima precisione.

Ottimizzazione delle risorse OCR

La libreria OCR C# di Aspose consente un bilanciamento altamente flessibile tra velocità di riconoscimento, qualità e utilizzo delle risorse per ogni caso d’uso specifico:

  • Scegli tra riconoscimento approfondito e riconoscimento rapido.
  • Specifica il numero di thread allocati per il riconoscimento o consenti alla nostra libreria .NET OCR di adattarsi automaticamente al numero di core del processore.
  • Libera la CPU scaricando i calcoli sulla GPU.

Oltre 140 lingue di riconoscimento

La nostra libreria C# OCR è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto di una vasta gamma di scritture europee, mediorientali e asiatiche, è adatto a qualsiasi paese e azienda.

È possibile riconoscere documenti scritti in lingue miste, come cinese/inglese, arabo/francese o cirillico/inglese. Sono supportate le seguenti lingue:

  • Latino esteso: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e oltre 80 altri;
  • Alfabeto cirillico: russo, ucraino, kazako, bulgaro, inclusi testi misti cirillico/inglese;
  • Arabo, persiano, urdu, compresi testi misti con inglese;
  • Lingue cinesi, coreane, giapponesi, devanagari e dravidiche, tra cui hindi, tamil, marathi e altre.

Caratteristiche e capacità

C# OCR estrae automaticamente il testo da foto o scansioni, eliminando la necessità di riscrivere manualmente i documenti.

Feature icon

OCR di foto

Estrai testo dalle foto dello smartphone con precisione a livello di scansione.

Feature icon

PDF ricercabile

Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.

Feature icon

Riconoscimento dell’URL

Riconoscere un’immagine dall’URL senza scaricarla localmente.

Feature icon

Riconoscimento in blocco

Leggi tutte le immagini da documenti, cartelle e archivi multipagina.

Feature icon

Qualsiasi carattere e stile

Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.

Feature icon

Riconoscimento preciso

Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.

Feature icon

Controllo ortografico

Migliora i risultati correggendo automaticamente le parole errate.

Feature icon

Trova il testo nelle immagini

Cerca testo o espressione regolare all’interno di una serie di immagini.

Feature icon

Confronta i testi delle immagini

Confronta i testi su due immagini, indipendentemente dal caso e dal layout.

OCR facile da usare

Con la nostra API C# OCR, ti bastano poche righe di codice C# per convertire un’immagine in testo, creare un PDF ricercabile, salvare i risultati del riconoscimento in un documento e molto altro ancora. Esplora gli esempi di codice per capire come integrare la nostra API OCR nelle tue soluzioni .NET.

Installazione

.NET OCR è distribuito come pacchetto NuGet o come [file scaricabile]( https://releases.aspose.com/ocr/net /) con dipendenze minime. Il pacchetto può essere aggiunto al tuo progetto direttamente da Microsoft Visual Studio. Installalo semplicemente nel tuo progetto e sei pronto per estrarre testo dalle immagini e salvare i risultati del riconoscimento in uno qualsiasi dei formati supportati. Se il tuo sistema dispone di una GPU compatibile con CUDA, puoi utilizzare il motore OCR con accelerazione GPU per aumentare significativamente le prestazioni di riconoscimento.

Puoi iniziare a utilizzare Aspose OCR per .NET subito dopo l’installazione con alcune restrizioni . Una licenza temporanea rimuove tutte le limitazioni della versione di prova per 30 giorni. Usalo per iniziare a creare un’applicazione OCR completamente funzionale e prendere la decisione finale di acquistare l’OCR per .NET in un secondo momento.

Estrai testo da una foto

Quando le persone in genere pensano all’OCR (riconoscimento ottico dei caratteri), la prima associazione è spesso con uno scanner come dispositivo di acquisizione principale. Questa associazione ha ragioni storiche ed è ancora prevalente in molti contesti, fornendo un ambiente coerente e controllato per l’acquisizione di testo stampato da documenti fisici con una qualità senza pari. Tuttavia, uno scanner è un’apparecchiatura specializzata che non è sempre a portata di mano e richiede il funzionamento di una postazione di lavoro fissa. Fortunatamente, il mondo moderno offre una comoda alternativa agli scanner tradizionali: la fotocamera dello smartphone. I progressi nella tecnologia delle fotocamere degli smartphone garantiscono che anche uno smartphone entry-level fornisca una qualità sufficiente per acquisire documenti pronti per l’OCR. Inoltre, la memoria integrata semplifica più che mai la digitalizzazione di grandi quantità di documenti, giornali, libri, segnali stradali e altri testi mentre sei in movimento. Tutto ciò di cui hai bisogno è la tecnologia giusta per convertire quelle foto in testo leggibile dalla macchina.

La nostra libreria C# OCR è progettata specificamente per riconoscere tutti i tipi di immagini immediatamente e può essere ulteriormente ottimizzata per gestire anche le foto di bassa qualità. In combinazione con uno smartphone moderno, consente di creare potenti applicazioni OCR per la maggior parte delle attività quotidiane di scansione e riconoscimento del testo. L’elaborazione delle immagini e l’analisi della struttura dei documenti più avanzate vengono eseguite in poche righe di codice, consentendoti di concentrarti sul business piuttosto che su complessi algoritmi matematici, reti neurali e altre complessità tecniche.

OCR foto - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Crea un PDF ricercabile dalla scansione

Il PDF è uno dei formati più popolari per la scansione di documenti cartacei, soprattutto grazie alla sua capacità di combinare più pagine in un unico file. Questo formato è ampiamente utilizzato per lo scambio di contratti, fatture, documenti legali, passaporti e carte d’identità e molti altri documenti tra privati, aziende, banche ed enti governativi. Tuttavia, qualsiasi PDF scansionato è essenzialmente una raccolta di immagini. Non contiene testo leggibile dalla macchina, quindi gli utenti non possono cercare, copiare o manipolare in altro modo il contenuto del documento.

Aspose .NET OCR ti offre un modo veloce, facile e altamente affidabile per convertire qualsiasi PDF scansionato in un documento completamente ricercabile e indicizzabile. Riconosce accuratamente il contenuto della pagina, convertendolo in uno strato di testo leggibile dalla macchina sopra l’immagine originale che può essere selezionato, copiato, letto da software di sintesi vocale e persino elaborato automaticamente da traduttori, riassunti e altri strumenti di analisi basati sull’intelligenza artificiale utensili.

Aggiungi sovrapposizione di testo al PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Cerca testo nelle immagini

Gli archivi digitali, soprattutto nelle grandi organizzazioni, sono spesso costituiti da una vasta raccolta di scansioni e foto, molte delle quali possono contenere documenti multipagina. La gestione efficiente e l’organizzazione efficace di tali archivi sono essenziali per un facile recupero e navigazione delle informazioni. Tuttavia, le immagini non contengono testo leggibile dalla macchina, rendendo impossibile la ricerca e l’analisi del contenuto del documento.

La libreria C# OCR ti consente di cercare facilmente il testo nelle immagini, indipendentemente dal carattere, dalla dimensione del testo, dallo stile e da altri parametri. La libreria supporta anche ricerche senza distinzione tra maiuscole e minuscole ed espressioni regolari, che sono estremamente utili in varie applicazioni e settori. Questa funzionalità può essere utilizzata per classificare i documenti in base al contenuto, alle parole chiave o ai modelli presenti nel testo; ricerca di termini o clausole specifiche all’interno di accordi e contratti; riorganizzare i file in base a parole chiave o contenuti presenti al loro interno; individuare e identificare i dati personali all’interno dei documenti, semplificando la garanzia della conformità al GDPR e la gestione delle informazioni sensibili in modo più efficace. La ricerca all’interno delle immagini consente inoltre di creare flussi di lavoro automatizzati e di semplificare vari processi aziendali dopo aver ricevuto contratti e fatture firmati.

Cerca testo nelle immagini - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}