Libreria C# OCR per applicazioni .NET
Converti immagine in testo in C# OCR
Più vetrine >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Perché scegliere la libreria Aspose OCR?
Crea potenti funzionalità OCR nelle tue app .NET in pochi secondi. La nostra API OCR di facile utilizzo ti consente di estrarre testo da immagini e scansioni, creare PDF ricercabili e altro ancora con un codice C# minimo. Ideale per funzioni desktop .NET, Web, cloud e serverless. Fai clic sugli elementi seguenti per saperne di più sulle nostre funzionalità e vantaggi.
Applicazioni OCR globali
C# OCR riconosce testi in inglese, cirillico, arabo, persiano, cinese, giapponese, coreano, hindi, tamil e in lingue miste.
Leggi tutto
Ottieni testo da qualsiasi file ottenuto tramite uno scanner o una fotocamera ed elabora le immagini direttamente dai collegamenti web.
Risultati affidabili
Ottieni un'elevata precisione di riconoscimento per tutte le immagini, comprese quelle fuori fuoco, ruotate, distorte e rumorose.
Riconoscimento batch
Riconoscere in blocco tutte le immagini da cartelle e archivi; leggere documenti PDF multipagina e immagini TIFF.
Rilevamento del layout
Identifica e classifica i blocchi di contenuto nelle immagini per garantire l'ordine corretto del testo estratto, indipendentemente dal layout.
Esempio di codice in tempo reale
.NET OCR diventa un compito banale e diretto con l’API Aspose OCR, anche per i nuovi sviluppatori. Bastano poche righe di codice per estrarre il testo da un’immagine e visualizzarlo sullo schermo. È davvero così semplice: provalo.
*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.
Converti immagine in testo
Altri esempi >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Indipendenza dalla piattaforma
La libreria OCR multipiattaforma può funzionare ovunque in .NET, .NET Core o .NET Framework, sia su un computer locale, sia su web server o nel cloud.
Formati di file supportati
Aspose.OCR for .NET può funzionare con qualsiasi file puoi ottenerlo da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.
Immagini
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR batch
- Multi-page PDF
- DjVu
- ZIP
- Folder
Risultati del riconoscimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Adatto a qualsiasi contenuto
L’accuratezza e l’affidabilità del riconoscimento del testo in C# dipendono in gran parte dalla qualità dell’immagine. .NET OCR offre una serie completa di ottimizzazione delle immagini automatizzata e manuale, garantendo risultati di riconoscimento superiori.
La potente elaborazione delle immagini, il rilevamento del testo completamente personalizzabile, la post-elaborazione e la correzione ortografica automatizzata consentono l’estrazione del testo da qualsiasi scansione o foto con la massima precisione.
Ottimizzazione delle risorse OCR
La libreria OCR C# di Aspose consente un bilanciamento altamente flessibile tra velocità di riconoscimento, qualità e utilizzo delle risorse per ogni caso d’uso specifico:
- Scegli tra riconoscimento approfondito e riconoscimento rapido.
- Specifica il numero di thread allocati per il riconoscimento o consenti alla nostra libreria .NET OCR di adattarsi automaticamente al numero di core del processore.
- Libera la CPU scaricando i calcoli sulla GPU.
Oltre 140 lingue di riconoscimento
La nostra libreria C# OCR è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto di una vasta gamma di scritture europee, mediorientali e asiatiche, è adatto a qualsiasi paese e azienda.
È possibile riconoscere documenti scritti in lingue miste, come cinese/inglese, arabo/francese o cirillico/inglese. Sono supportate le seguenti lingue:
- Latino esteso: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e oltre 80 altri;
- Alfabeto cirillico: russo, ucraino, kazako, bulgaro, inclusi testi misti cirillico/inglese;
- Arabo, persiano, urdu, compresi testi misti con inglese;
- Lingue cinesi, coreane, giapponesi, devanagari e dravidiche, tra cui hindi, tamil, marathi e altre.
Caratteristiche e capacità
C# OCR estrae automaticamente il testo da foto o scansioni, eliminando la necessità di riscrivere manualmente i documenti.
OCR di foto
Estrai testo dalle foto dello smartphone con precisione a livello di scansione.
PDF ricercabile
Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.
Riconoscimento dell’URL
Riconoscere un’immagine dall’URL senza scaricarla localmente.
Riconoscimento in blocco
Leggi tutte le immagini da documenti, cartelle e archivi multipagina.
Qualsiasi carattere e stile
Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.
Riconoscimento preciso
Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.
Controllo ortografico
Migliora i risultati correggendo automaticamente le parole errate.
Trova il testo nelle immagini
Cerca testo o espressione regolare all’interno di una serie di immagini.
Confronta i testi delle immagini
Confronta i testi su due immagini, indipendentemente dal caso e dal layout.
OCR facile da usare
Con la nostra API C# OCR, ti bastano poche righe di codice C# per convertire un’immagine in testo, creare un PDF ricercabile, salvare i risultati del riconoscimento in un documento e molto altro ancora. Esplora gli esempi di codice per capire come integrare la nostra API OCR nelle tue soluzioni .NET.
Installazione
Puoi iniziare a utilizzare Aspose OCR per .NET subito dopo l’installazione con alcune restrizioni . Una licenza temporanea rimuove tutte le limitazioni della versione di prova per 30 giorni. Usalo per iniziare a creare un’applicazione OCR completamente funzionale e prendere la decisione finale di acquistare l’OCR per .NET in un secondo momento.
Estrai testo da una foto
Quando le persone in genere pensano all’OCR (riconoscimento ottico dei caratteri), la prima associazione è spesso con uno scanner come dispositivo di acquisizione principale. Questa associazione ha ragioni storiche ed è ancora prevalente in molti contesti, fornendo un ambiente coerente e controllato per l’acquisizione di testo stampato da documenti fisici con una qualità senza pari. Tuttavia, uno scanner è un’apparecchiatura specializzata che non è sempre a portata di mano e richiede il funzionamento di una postazione di lavoro fissa. Fortunatamente, il mondo moderno offre una comoda alternativa agli scanner tradizionali: la fotocamera dello smartphone. I progressi nella tecnologia delle fotocamere degli smartphone garantiscono che anche uno smartphone entry-level fornisca una qualità sufficiente per acquisire documenti pronti per l’OCR. Inoltre, la memoria integrata semplifica più che mai la digitalizzazione di grandi quantità di documenti, giornali, libri, segnali stradali e altri testi mentre sei in movimento. Tutto ciò di cui hai bisogno è la tecnologia giusta per convertire quelle foto in testo leggibile dalla macchina.
La nostra libreria C# OCR è progettata specificamente per riconoscere tutti i tipi di immagini immediatamente e può essere ulteriormente ottimizzata per gestire anche le foto di bassa qualità. In combinazione con uno smartphone moderno, consente di creare potenti applicazioni OCR per la maggior parte delle attività quotidiane di scansione e riconoscimento del testo. L’elaborazione delle immagini e l’analisi della struttura dei documenti più avanzate vengono eseguite in poche righe di codice, consentendoti di concentrarti sul business piuttosto che su complessi algoritmi matematici, reti neurali e altre complessità tecniche.
OCR foto - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Crea un PDF ricercabile dalla scansione
Il PDF è uno dei formati più popolari per la scansione di documenti cartacei, soprattutto grazie alla sua capacità di combinare più pagine in un unico file. Questo formato è ampiamente utilizzato per lo scambio di contratti, fatture, documenti legali, passaporti e carte d’identità e molti altri documenti tra privati, aziende, banche ed enti governativi. Tuttavia, qualsiasi PDF scansionato è essenzialmente una raccolta di immagini. Non contiene testo leggibile dalla macchina, quindi gli utenti non possono cercare, copiare o manipolare in altro modo il contenuto del documento.
Aspose .NET OCR ti offre un modo veloce, facile e altamente affidabile per convertire qualsiasi PDF scansionato in un documento completamente ricercabile e indicizzabile. Riconosce accuratamente il contenuto della pagina, convertendolo in uno strato di testo leggibile dalla macchina sopra l’immagine originale che può essere selezionato, copiato, letto da software di sintesi vocale e persino elaborato automaticamente da traduttori, riassunti e altri strumenti di analisi basati sull’intelligenza artificiale utensili.
Aggiungi sovrapposizione di testo al PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Cerca testo nelle immagini
Gli archivi digitali, soprattutto nelle grandi organizzazioni, sono spesso costituiti da una vasta raccolta di scansioni e foto, molte delle quali possono contenere documenti multipagina. La gestione efficiente e l’organizzazione efficace di tali archivi sono essenziali per un facile recupero e navigazione delle informazioni. Tuttavia, le immagini non contengono testo leggibile dalla macchina, rendendo impossibile la ricerca e l’analisi del contenuto del documento.
La libreria C# OCR ti consente di cercare facilmente il testo nelle immagini, indipendentemente dal carattere, dalla dimensione del testo, dallo stile e da altri parametri. La libreria supporta anche ricerche senza distinzione tra maiuscole e minuscole ed espressioni regolari, che sono estremamente utili in varie applicazioni e settori. Questa funzionalità può essere utilizzata per classificare i documenti in base al contenuto, alle parole chiave o ai modelli presenti nel testo; ricerca di termini o clausole specifiche all’interno di accordi e contratti; riorganizzare i file in base a parole chiave o contenuti presenti al loro interno; individuare e identificare i dati personali all’interno dei documenti, semplificando la garanzia della conformità al GDPR e la gestione delle informazioni sensibili in modo più efficace. La ricerca all’interno delle immagini consente inoltre di creare flussi di lavoro automatizzati e di semplificare vari processi aziendali dopo aver ricevuto contratti e fatture firmati.
Cerca testo nelle immagini - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}