API OCR nativa per applicazioni .NET
Converti immagine in testo in C#
Più vetrine >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Perché Aspose.OCR per .NET?
Aspose.OCR per .NET è un’API robusta, intuitiva per gli sviluppatori ed economica per il riconoscimento ottico dei caratteri. In meno di 10 righe di codice C# nativo, puoi integrare funzionalità OCR nelle tue soluzioni desktop .NET, applicazioni Web basate su MVC, servizi cloud e funzioni serverless di Azure. Estrai testo leggibile dalla macchina da scansioni, foto e screenshot, converti le pagine scansionate in PDF ricercabili e indicizzabili, trova e confronta testo su immagini concentrandoti su attività aziendali piuttosto che su calcoli matematici complessi, reti neurali e altre complessità tecniche. Fai clic sugli elementi seguenti per saperne di più sulle nostre funzionalità e vantaggi.
Applicazioni globali
Riconoscere testi in caratteri latini, cirillici e asiatici, inclusi oltre 6.000 caratteri cinesi e hindi.
Leggi tutto
Recupera testo da qualsiasi file ottenuto tramite uno scanner o una fotocamera ed elabora le immagini direttamente dai collegamenti web.
Risultati affidabili
Ottieni un'elevata precisione di riconoscimento per tutte le immagini, comprese quelle fuori fuoco, ruotate, distorte e rumorose.
Riconoscimento batch
Riconoscere in blocco tutte le immagini da cartelle e archivi; leggere documenti PDF multipagina e immagini TIFF.
Rilevamento del layout
Identifica e classifica i blocchi di contenuto nelle immagini per garantire l'ordine corretto del testo estratto, indipendentemente dal layout.
Esempio di codice in tempo reale
Il riconoscimento ottico dei caratteri diventa un compito banale e diretto con Aspose.OCR, anche per gli sviluppatori nuovi alla tecnologia. Bastano poche righe di codice per estrarre il testo da un’immagine e visualizzarlo sullo schermo. È davvero così semplice: provalo.
*Caricando i tuoi file o utilizzando il servizio accetti i nostri Termini di utilizzo E politica sulla riservatezza.
Converti immagine in testo
Altri esempi >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Indipendenza dalla piattaforma
Aspose.OCR per .NET può funzionare su qualsiasi piattaforma che supporti .NET, .NET Core o .NET Framework, sia su un locale macchina, sul server web o nel cloud.
Formati di file supportati
Aspose.OCR for .NET può funzionare praticamente con qualsiasi file puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento vengono restituiti nei formati di file e di scambio dati più diffusi che possono essere salvati, importati in un database o analizzati in tempo reale.
immagini
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR batch
- Multi-page PDF
- DjVu
- ZIP
- Folder
Risultati del riconoscimento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Adatto a qualsiasi contenuto
La precisione e l’affidabilità del riconoscimento del testo dipendono fortemente dalla qualità dell’immagine originale. Aspose.OCR per .NET fornisce una vasta gamma di filtri di elaborazione delle immagini sia completamente automatizzati che manuali che migliorano un’immagine prima che venga inviata al motore OCR.
La potente elaborazione delle immagini e gli algoritmi di rilevamento della struttura dei contenuti personalizzabili consentono l’estrazione del testo praticamente da qualsiasi immagine, dalle scansioni di alta qualità alle foto stradali. È possibile applicare più filtri di elaborazione alla stessa immagine per ottenere la migliore qualità di riconoscimento.
Ottimizzazione delle risorse
Aspose.OCR per .NET consente un bilanciamento altamente flessibile tra velocità di riconoscimento, qualità e utilizzo delle risorse per ogni caso d’uso specifico:
- Scegli tra riconoscimento approfondito e riconoscimento rapido.
- Specifica il numero di thread allocati per il riconoscimento o consenti alla libreria di adattarsi automaticamente al numero di core del processore.
- Libera la CPU scaricando i calcoli sulla GPU.
Oltre 130 lingue di riconoscimento
Aspose.OCR per .NET è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto di una vasta gamma di scritture europee, mediorientali e asiatiche, è adatto a qualsiasi scala e si rivolge sia alle piccole e medie imprese che alle multinazionali.
È possibile delegare il rilevamento della lingua alla libreria o specificare manualmente la lingua, migliorando le prestazioni e l’affidabilità del riconoscimento. Sono supportate le seguenti lingue:
- Alfabeto latino esteso: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e oltre 80 altri;
- Alfabeto cirillico: russo, ucraino, kazako, serbo, bielorusso, bulgaro;
- arabo, persiano, urdu;
- Scrittura cinese e devanagari, inclusi hindi, marathi, bhojpuri e altri.
Caratteristiche e capacità
Aspose.OCR per .NET estrae automaticamente il testo da foto o immagini scansionate, eliminando la necessità di riscrivere manualmente i documenti.
OCR di foto
Estrai testo dalle foto dello smartphone con precisione a livello di scansione.
PDF ricercabile
Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.
Riconoscimento dell’URL
Riconoscere un’immagine dall’URL senza scaricarla localmente.
Riconoscimento in blocco
Leggi tutte le immagini da documenti, cartelle e archivi multipagina.
Qualsiasi carattere e stile
Identifica e riconosci il testo in tutti i caratteri tipografici e gli stili più diffusi.
Riconoscimento preciso
Regola ogni parametro OCR per ottenere i migliori risultati di riconoscimento.
Correttore ortografico
Migliora i risultati correggendo automaticamente le parole errate.
Trova il testo nelle immagini
Cerca testo o espressione regolare all’interno di una serie di immagini.
Confronta i testi delle immagini
Confronta i testi su due immagini, indipendentemente dal caso e dal layout.
Facile da usare
Sono necessarie solo poche righe di codice per convertire un’immagine in testo, creare un PDF ricercabile, salvare i risultati del riconoscimento in un documento e molto altro ancora. Esplora gli esempi di codice per capire come integrare Aspose.OCR per .NET nelle tue soluzioni.
Installazione
Puoi iniziare a utilizzare Aspose.OCR per .NET subito dopo l’installazione con alcune restrizioni . Una licenza temporanea rimuove tutte le limitazioni della versione di prova per 30 giorni. Usalo per iniziare a creare un’applicazione OCR completamente funzionale e prendere la decisione finale di acquistare Aspose.OCR per .NET in seguito.
Estrai testo da una foto
Quando le persone in genere pensano all’OCR (riconoscimento ottico dei caratteri), la prima associazione è spesso con uno scanner come dispositivo di acquisizione principale. Questa associazione ha ragioni storiche ed è ancora prevalente in molti contesti, fornendo un ambiente coerente e controllato per l’acquisizione di testo stampato da documenti fisici con una qualità senza pari. Tuttavia, uno scanner è un’apparecchiatura specializzata che non è sempre a portata di mano e richiede il funzionamento di una postazione di lavoro fissa. Fortunatamente, il mondo moderno offre una comoda alternativa agli scanner tradizionali: la fotocamera dello smartphone. I progressi nella tecnologia delle fotocamere degli smartphone garantiscono che anche uno smartphone entry-level fornisca una qualità sufficiente per acquisire documenti pronti per l’OCR. Inoltre, la memoria integrata semplifica più che mai la digitalizzazione di grandi quantità di documenti, giornali, libri, segnali stradali e altri testi mentre sei in movimento. Tutto ciò di cui hai bisogno è la tecnologia giusta per convertire quelle foto in testo leggibile dalla macchina.
Aspose.OCR per .NET è specificamente progettato per riconoscere tutti i tipi di immagini immediatamente e può essere ulteriormente perfezionato per gestire anche le foto di bassa qualità. In combinazione con uno smartphone moderno, consente di creare potenti applicazioni OCR per la maggior parte delle attività quotidiane di scansione e riconoscimento del testo. L’elaborazione delle immagini e l’analisi della struttura dei documenti più avanzate vengono eseguite in poche righe di codice, consentendoti di concentrarti sul business piuttosto che su complessi algoritmi matematici, reti neurali e altre complessità tecniche.
OCR foto - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Crea un PDF ricercabile dalla scansione
Il PDF è uno dei formati più popolari per la scansione di documenti cartacei, soprattutto grazie alla sua capacità di combinare più pagine in un unico file. Questo formato è ampiamente utilizzato per lo scambio di contratti, fatture, documenti legali, passaporti e carte d’identità e molti altri documenti tra privati, aziende, banche ed enti governativi. Tuttavia, qualsiasi PDF scansionato è essenzialmente una raccolta di immagini. Non contiene testo leggibile dalla macchina, quindi gli utenti non possono cercare, copiare o manipolare in altro modo il contenuto del documento.
Aspose.OCR per .NET ti offre un modo veloce, facile e altamente affidabile per convertire qualsiasi PDF scansionato in un documento completamente ricercabile e indicizzabile. Riconosce accuratamente il contenuto della pagina, convertendolo in uno strato di testo leggibile dalla macchina sopra l’immagine originale che può essere selezionato, copiato, letto da software di sintesi vocale e persino elaborato automaticamente da traduttori, riassunti e altri strumenti di analisi basati sull’intelligenza artificiale utensili.
Aggiungi sovrapposizione di testo al PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Cerca testo nelle immagini
Gli archivi digitali, soprattutto nelle grandi organizzazioni, sono spesso costituiti da una vasta raccolta di scansioni e foto, molte delle quali possono contenere documenti multipagina. La gestione efficiente e l’organizzazione efficace di tali archivi sono essenziali per un facile recupero e navigazione delle informazioni. Tuttavia, le immagini non contengono testo leggibile dalla macchina, rendendo impossibile la ricerca e l’analisi del contenuto del documento.
Aspose.OCR per .NET ti consente di cercare facilmente testo nelle immagini, indipendentemente dal carattere, dalla dimensione del testo, dallo stile e da altri parametri. La libreria supporta anche ricerche senza distinzione tra maiuscole e minuscole ed espressioni regolari, che sono estremamente utili in varie applicazioni e settori. Questa funzionalità può essere utilizzata per classificare i documenti in base al contenuto, alle parole chiave o ai modelli presenti nel testo; ricerca di termini o clausole specifiche all’interno di accordi e contratti; riorganizzare i file in base a parole chiave o contenuti presenti al loro interno; individuare e identificare i dati personali all’interno dei documenti, semplificando la garanzia della conformità al GDPR e la gestione delle informazioni sensibili in modo più efficace. La ricerca all’interno delle immagini consente inoltre di creare flussi di lavoro automatizzati e di semplificare vari processi aziendali dopo aver ricevuto contratti e fatture firmati.
Cerca testo nelle immagini - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}