Perché Aspose.OCR per .NET?

Aspose.OCR per .NET è un’API robusta, intuitiva per gli sviluppatori ed economica per il riconoscimento ottico dei caratteri. In meno di 10 righe di codice C# nativo, puoi integrare funzionalità OCR nelle tue soluzioni desktop .NET, applicazioni Web basate su MVC, servizi cloud e funzioni serverless di Azure. Estrai testo leggibile dalla macchina da scansioni, foto e screenshot, converti le pagine scansionate in PDF ricercabili e indicizzabili, trova e confronta testo su immagini concentrandoti su attività aziendali piuttosto che su calcoli matematici complessi, reti neurali e altre complessità tecniche. Fai clic sugli elementi seguenti per saperne di più sulle nostre funzionalità e vantaggi.

Illustration ocr

Applicazioni globali

Riconoscere testi in caratteri latini, cirillici e asiatici, inclusi oltre 6.000 caratteri cinesi e hindi.

Leggi tutto

Recupera testo da qualsiasi file ottenuto tramite uno scanner o una fotocamera ed elabora le immagini direttamente dai collegamenti web.

Risultati affidabili

Ottieni un'elevata precisione di riconoscimento per tutte le immagini, comprese quelle fuori fuoco, ruotate, distorte e rumorose.

Riconoscimento batch

Riconoscere in blocco tutte le immagini da cartelle e archivi; leggere documenti PDF multipagina e immagini TIFF.

Rilevamento del layout

Identifica e classifica i blocchi di contenuto nelle immagini per garantire l'ordine corretto del testo estratto, indipendentemente dal layout.

Esempio di codice in tempo reale

Il riconoscimento ottico dei caratteri diventa un compito banale e diretto con Aspose.OCR, anche per gli sviluppatori nuovi alla tecnologia. Bastano poche righe di codice per estrarre il testo da un’immagine e visualizzarlo sullo schermo. È davvero così semplice: provalo.

Pronto a riconoscere Pronto a riconoscere Trascina un file qui o fai clic per sfogliare *

*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.

Risultato del riconoscimento
 

Converti immagine in testo

Altri esempi >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Indipendenza dalla piattaforma

Aspose.OCR per .NET può funzionare su qualsiasi piattaforma che supporti .NET, .NET Core o .NET Framework, sia su un locale macchina, sul server web o nel cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formati di file supportati

Aspose.OCR for .NET può funzionare praticamente con qualsiasi file puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento vengono restituiti nei formati di file e di scambio dati più diffusi che possono essere salvati, importati in un database o analizzati in tempo reale.

immagini

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR batch

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Risultati del riconoscimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Adatto a qualsiasi contenuto

La precisione e l’affidabilità del riconoscimento del testo dipendono fortemente dalla qualità dell’immagine originale. Aspose.OCR per .NET fornisce una vasta gamma di filtri di elaborazione delle immagini sia completamente automatizzati che manuali che migliorano un’immagine prima che venga inviata al motore OCR.

La potente elaborazione delle immagini e gli algoritmi di rilevamento della struttura dei contenuti personalizzabili consentono l’estrazione del testo praticamente da qualsiasi immagine, dalle scansioni di alta qualità alle foto stradali. È possibile applicare più filtri di elaborazione alla stessa immagine per ottenere la migliore qualità di riconoscimento.

Ottimizzazione delle risorse

Aspose.OCR per .NET consente un bilanciamento altamente flessibile tra velocità di riconoscimento, qualità e utilizzo delle risorse per ogni caso d’uso specifico:

  • Scegli tra riconoscimento approfondito e riconoscimento rapido.
  • Specifica il numero di thread allocati per il riconoscimento o consenti alla libreria di adattarsi automaticamente al numero di core del processore.
  • Libera la CPU scaricando i calcoli sulla GPU.

Oltre 130 lingue di riconoscimento

Aspose.OCR per .NET è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto di una vasta gamma di scritture europee, mediorientali e asiatiche, è adatto a qualsiasi scala e si rivolge sia alle piccole e medie imprese che alle multinazionali.

È possibile delegare il rilevamento della lingua alla libreria o specificare manualmente la lingua, migliorando le prestazioni e l’affidabilità del riconoscimento. Sono supportate le seguenti lingue:

  • Alfabeto latino esteso: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e oltre 80 altri;
  • Alfabeto cirillico: russo, ucraino, kazako, serbo, bielorusso, bulgaro;
  • arabo, persiano, urdu;
  • Scrittura cinese e devanagari, inclusi hindi, marathi, bhojpuri e altri.

Caratteristiche e capacità

Aspose.OCR per .NET estrae automaticamente il testo da foto o immagini scansionate, eliminando la necessità di riscrivere manualmente i documenti.

Feature icon

OCR di foto

Estrai testo dalle foto dello smartphone con precisione a livello di scansione.

Feature icon

PDF ricercabile

Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.

Feature icon

Riconoscimento dell’URL

Riconoscere un’immagine dall’URL senza scaricarla localmente.

Feature icon

Riconoscimento in blocco

Leggi tutte le immagini da documenti, cartelle e archivi multipagina.

Feature icon

Qualsiasi carattere e stile

Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.

Feature icon

Riconoscimento preciso

Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.

Feature icon

Correttore ortografico

Migliora i risultati correggendo automaticamente le parole errate.

Feature icon

Trova il testo nelle immagini

Cerca testo o espressione regolare all’interno di una serie di immagini.

Feature icon

Confronta i testi delle immagini

Confronta i testi su due immagini, indipendentemente dal caso e dal layout.

Facile da usare

Sono necessarie solo poche righe di codice per convertire un’immagine in testo, creare un PDF ricercabile, salvare i risultati del riconoscimento in un documento e molto altro ancora. Esplora gli esempi di codice per capire come integrare Aspose.OCR per .NET nelle tue soluzioni.

Installazione

Aspose.OCR per .NET è distribuito come pacchetto NuGet o come [file scaricabile]( https://releases.aspose.com/ ocr/net/) con dipendenze minime. Il pacchetto può essere aggiunto al tuo progetto direttamente da Microsoft Visual Studio. Installalo semplicemente nel tuo progetto e sei pronto per estrarre il testo dalle immagini e salvare i risultati del riconoscimento in uno qualsiasi dei formati supportati. Se il tuo sistema dispone di una GPU compatibile con CUDA, puoi utilizzare il motore OCR con accelerazione GPU per aumentare significativamente le prestazioni di riconoscimento.

Puoi iniziare a utilizzare Aspose.OCR per .NET subito dopo l’installazione con alcune restrizioni . Una licenza temporanea rimuove tutte le limitazioni della versione di prova per 30 giorni. Usalo per iniziare a creare un’applicazione OCR completamente funzionale e prendere la decisione finale di acquistare Aspose.OCR per .NET in seguito.

Estrai testo da una foto

Quando le persone in genere pensano all’OCR (riconoscimento ottico dei caratteri), la prima associazione è spesso con uno scanner come dispositivo di acquisizione principale. Questa associazione ha ragioni storiche ed è ancora prevalente in molti contesti, fornendo un ambiente coerente e controllato per l’acquisizione di testo stampato da documenti fisici con una qualità senza pari. Tuttavia, uno scanner è un’apparecchiatura specializzata che non è sempre a portata di mano e richiede il funzionamento di una postazione di lavoro fissa. Fortunatamente, il mondo moderno offre una comoda alternativa agli scanner tradizionali: la fotocamera dello smartphone. I progressi nella tecnologia delle fotocamere degli smartphone garantiscono che anche uno smartphone entry-level fornisca una qualità sufficiente per acquisire documenti pronti per l’OCR. Inoltre, la memoria integrata semplifica più che mai la digitalizzazione di grandi quantità di documenti, giornali, libri, segnali stradali e altri testi mentre sei in movimento. Tutto ciò di cui hai bisogno è la tecnologia giusta per convertire quelle foto in testo leggibile dalla macchina.

Aspose.OCR per .NET è specificamente progettato per riconoscere tutti i tipi di immagini immediatamente e può essere ulteriormente perfezionato per gestire anche le foto di bassa qualità. In combinazione con uno smartphone moderno, consente di creare potenti applicazioni OCR per la maggior parte delle attività quotidiane di scansione e riconoscimento del testo. L’elaborazione delle immagini e l’analisi della struttura dei documenti più avanzate vengono eseguite in poche righe di codice, consentendoti di concentrarti sul business piuttosto che su complessi algoritmi matematici, reti neurali e altre complessità tecniche.

OCR foto - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Crea un PDF ricercabile dalla scansione

Il PDF è uno dei formati più popolari per la scansione di documenti cartacei, soprattutto grazie alla sua capacità di combinare più pagine in un unico file. Questo formato è ampiamente utilizzato per lo scambio di contratti, fatture, documenti legali, passaporti e carte d’identità e molti altri documenti tra privati, aziende, banche ed enti governativi. Tuttavia, qualsiasi PDF scansionato è essenzialmente una raccolta di immagini. Non contiene testo leggibile dalla macchina, quindi gli utenti non possono cercare, copiare o manipolare in altro modo il contenuto del documento.

Aspose.OCR per .NET ti offre un modo veloce, facile e altamente affidabile per convertire qualsiasi PDF scansionato in un documento completamente ricercabile e indicizzabile. Riconosce accuratamente il contenuto della pagina, convertendolo in uno strato di testo leggibile dalla macchina sopra l’immagine originale che può essere selezionato, copiato, letto da software di sintesi vocale e persino elaborato automaticamente da traduttori, riassunti e altri strumenti di analisi basati sull’intelligenza artificiale utensili.

Aggiungi sovrapposizione di testo al PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Cerca testo nelle immagini

Gli archivi digitali, soprattutto nelle grandi organizzazioni, sono spesso costituiti da una vasta raccolta di scansioni e foto, molte delle quali possono contenere documenti multipagina. La gestione efficiente e l’organizzazione efficace di tali archivi sono essenziali per un facile recupero e navigazione delle informazioni. Tuttavia, le immagini non contengono testo leggibile dalla macchina, rendendo impossibile la ricerca e l’analisi del contenuto del documento.

Aspose.OCR per .NET ti consente di cercare facilmente testo nelle immagini, indipendentemente dal carattere, dalla dimensione del testo, dallo stile e da altri parametri. La libreria supporta anche ricerche senza distinzione tra maiuscole e minuscole ed espressioni regolari, che sono estremamente utili in varie applicazioni e settori. Questa funzionalità può essere utilizzata per classificare i documenti in base al contenuto, alle parole chiave o ai modelli presenti nel testo; ricerca di termini o clausole specifiche all’interno di accordi e contratti; riorganizzare i file in base a parole chiave o contenuti presenti al loro interno; individuare e identificare i dati personali all’interno dei documenti, semplificando la garanzia della conformità al GDPR e la gestione delle informazioni sensibili in modo più efficace. La ricerca all’interno delle immagini consente inoltre di creare flussi di lavoro automatizzati e di semplificare vari processi aziendali dopo aver ricevuto contratti e fatture firmati.

Cerca testo nelle immagini - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}