Perché scegliere la libreria OCR aspira?

Costruisci potenti funzionalità OCR nelle tue app .NET in pochi secondi. La nostra API OCR di facile utilizzo ti consente di estrarre testo da immagini e scansioni, creare PDF ricercabili e altro con codice C# minimo. Ideale per funzioni Desktop .NET, Web, cloud e senza server.
Esperienza OCR che non estrae solo il testo, ma lo comprende e lo migliora con l’IA. Fai clic sugli articoli seguenti per saperne di più sulle nostre funzionalità e vantaggi.

Illustration ocr

Applicazioni OCR globali

C# OCR riconosce i testi inglesi, cirillici, arabi, persiani, cinesi, giapponesi, coreani, hindi, tamil e in lingua mista.

Leggi tutto

Ottieni il testo da qualsiasi file ottenuto tramite uno scanner o una fotocamera ed elabora le immagini direttamente dai collegamenti Web.

Risultati affidabili

Ottenere un'elevata precisione di riconoscimento per tutte le immagini, comprese quelle che sono fuori focus, ruotate, distorte e rumorose.

Riconoscimento batch

Rognita in blocco tutte le immagini da cartelle e archivi; Leggi documenti PDF multi-pagina e immagini TIFF.

Rilevamento del layout

Identificare e classificare i blocchi di contenuto nelle immagini per garantire l'ordine corretto del testo estratto, indipendentemente dal layout.

AI Postprocessing usando LLMS

Non solo OCR: la tua soluzione AI all-in-one per il riconoscimento di testo più intelligente e senza errori. ASPUPE.OCR ora integra AI e LLMS per scegliere modelli che migliorano significativamente l'accuratezza dell'OCR: infilare gli errori, ripristinare il testo mancante e migliorare la qualità di riconoscimento generale.

Esempio di codice live

.NET OCR diventa un compito banale e diretto con l’API OCR Asposa, anche per i nuovi sviluppatori. Solo poche righe di codice sono sufficienti per estrarre il testo da un’immagine e visualizzarlo sullo schermo. È davvero così semplice: provalo.

Pronto a riconoscere Pronto a riconoscere Lascia cadere un file qui o fai clic per navigare *

* Caricando i tuoi file o utilizzando il servizio, sei d'accordo con il nostro Termini di utilizzo E politica sulla riservatezza.

Risultato di riconoscimento
 

Converti l'immagine in testo

Altri esempi >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Indipendenza della piattaforma

La libreria OCR cross-platform può funzionare ovunque sotto .net, .net core o .net framework-sia su una macchina locale, sul server web o in cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formati di file supportati

Aspose.OCR for .NET può funzionare con qualsiasi file Puoi ottenere da uno scanner o da una fotocamera. I risultati del riconoscimento possono essere salvati, importati in un database o analizzati in tempo reale.

Immagini

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Batch OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Risultati di riconoscimento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

OCR a propulsione LLM: la prossima generazione di OCR guidata dai modelli di lingua AI.

L’accuratezza dei risultati non si ferma al riconoscimento: sblocca il livello successivo di qualità perfezionando il testo utilizzando LLM esterni.

  • Correggi automaticamente l’ortografia e la grammatica nel testo riconosciuto.
  • Normalizza le incoerenze e la formattazione di problemi attraverso le scansioni multi-pagina.
  • Adatta i risultati del riconoscimento al vocabolario specifico del soggetto utilizzando modelli rapidi.
  • Integra qualsiasi pipeline LLM esterna nel flusso di lavoro OCR con poche righe di codice.

Adatto a qualsiasi contenuto

L’accuratezza e l’affidabilità del riconoscimento del testo in C# dipendono in gran parte dalla qualità dell’immagine. .NET OCR offre un set completo di ottimizzazione automatica e manuale delle immagini, garantendo risultati di riconoscimento superiore.

La potente elaborazione delle immagini, il rilevamento del testo completamente personalizzabile, la post-elaborazione e la correzione ortografica automatizzata abilitano l’estrazione di testo da qualsiasi scansione o foto con massima precisione.

Ottimizzazione delle risorse OCR

ASPUT ‘La libreria OCR# consente un bilanciamento altamente flessibile della velocità di riconoscimento, della qualità e dell’utilizzo delle risorse per ogni caso d’uso specifico:

  • Scegli tra riconoscimento approfondito e riconoscimento rapido.
  • Specificare il numero di thread assegnati per il riconoscimento o consentire alla nostra libreria OCR .NET di ridimensionare automaticamente il numero di core del processore.
  • Libera la CPU scaricando i calcoli alla GPU.

140+ lingue di riconoscimento

La nostra libreria C# OCR è una soluzione universale per l’elaborazione dei documenti, l’estrazione dei dati e la digitalizzazione dei contenuti su scala globale. Con il supporto per una vasta gamma di script di scrittura europei, medio-est e asiatici, è ben adattata per qualsiasi paese e attività.

Puoi riconoscere i documenti scritti in lingue miste, come cinese/inglese, arabo/francese o cirillico/inglese. Sono supportate le seguenti lingue:

  • ** Latino esteso **: inglese, spagnolo, francese, indonesiano, portoghese, tedesco, vietnamita, turco, italiano, polacco e altri 80+;
  • ** Cirillico ** Alphabet: russo, ucraino, kazako, bulgaro, compresi testi citi -cirillici/inglesi;
  • Arabo, persiano, urdu, compresi testi mescolati con l’inglese;
  • Le lingue cinesi, coreane, giapponesi, devanagari e dravidiche, tra cui hindi, tamil, marathi e altri.

Funzionalità e capacità

C# OCR estrae automaticamente il testo da foto o scansioni, eliminando la necessità di retipizzazione manuale dei documenti.

Feature icon

Foto OCR

Estrai il testo da foto di smartphone con precisione a livello di scansione.

Feature icon

PDF ricercabile

Converti qualsiasi scansione in un documento completamente ricercabile e indicizzabile.

Feature icon

Riconoscimento dell’URL

Riconosci un’immagine dall’URL senza scaricarla localmente.

Feature icon

Riconoscimento di massa

Leggi tutte le immagini da documenti, cartelle e archivi multi-pagina.

Feature icon

Qualsiasi carattere e stile

Identificare e riconoscere il testo in tutti i caratteri e gli stili popolari.

Feature icon

Riconoscere il riconoscimento

Regola ogni parametro OCR per i migliori risultati di riconoscimento.

Feature icon

Checker ortografico

Migliora i risultati correggendo automaticamente le parole errate.

Feature icon

Trova il testo nelle immagini

Cerca testo o espressione regolare all’interno di una serie di immagini.

Feature icon

Confronta i testi delle immagini

Confronta i testi su due immagini, indipendentemente dal caso e dal layout.

Feature icon

Correzione basata sull’intelligenza artificiale

Correggi parole errate errate e grammatica usando LLM basati su Transformer-nessuna formazione personalizzata richiesta.

Feature icon

Postprocessing semantico

Vai oltre i personaggi: perfeziona l’output OCR rumoroso con LLMS per una migliore qualità del contenuto e normalizzazione del linguaggio.

Feature icon

Pipeline LLM plug-in

Collegare i modelli di linguaggio esterno per correggere gli errori di riconoscimento OCR e ripristinare il testo incompleto o frammentato.

Facile da usare OCR

Con la nostra API C# OCR, hai solo bisogno di poche righe di codice C# per convertire l’immagine in testo, creare un PDF ricercabile, salvare i risultati di riconoscimento in documentazione e molti altri. Esplora i campioni di codice per capire come integrare la nostra API OCR nelle soluzioni .NET.

Installazione

.NET OCR è distribuito come un pacchetto NuGet o come file scaricabile con dipendenze minime. Il pacchetto può essere aggiunto al progetto direttamente da Microsoft Visual Studio. Basta installarlo sul tuo progetto e sei pronto per estrarre il testo dalle immagini e salvare i risultati del riconoscimento in uno qualsiasi dei formati supportati. Se il tuo sistema ha una GPU capace CUDA, è possibile utilizzare il motore OCR GPU-accelerato per aumentare significativamente le prestazioni di riconoscimento.

È possibile iniziare a utilizzare OCR ASPE per .NET subito dopo l’installazione con alcune restrizioni . Una licenza temporanea rimuove tutte le limitazioni della versione di prova per 30 giorni. Usalo per iniziare a creare un’applicazione OCR completamente funzionale e prendere la decisione finale di acquistare l’OCR per .NET in seguito.

Estrarre testo da una foto

Quando le persone in genere pensano all’OCR (riconoscimento ottico del carattere), la prima associazione è spesso con uno scanner come dispositivo di acquisizione primario. Questa associazione ha ragioni storiche ed è ancora prevalente in molti contesti, fornendo un ambiente coerente e controllato per l’acquisizione di testo stampato da documenti fisici con qualità senza pari. Tuttavia, uno scanner è un’apparecchiatura specializzata che non è sempre a portata di mano e richiede una workstation stazionaria per funzionare. Fortunatamente, il mondo moderno offre una comoda alternativa agli scanner tradizionali: una fotocamera per smartphone. I progressi della tecnologia della fotocamera per smartphone assicurano che anche uno smartphone entry-level fornisca una qualità sufficiente per acquisire documenti pronti per l’OCR. E la memoria integrata rende più facile che mai digitalizzare grandi quantità di documenti, giornali, libri, segnali stradali e altri testi in viaggio. Tutto ciò di cui hai bisogno è la tecnologia giusta per convertire quelle foto in testo leggibile dalla macchina.

La nostra libreria OCR C# è specificamente progettata per riconoscere tutti i tipi di immagini fuori dalla scatola e può essere ulteriormente messo a punto per gestire anche le foto di bassa qualità. Combinato con uno smartphone moderno, ti consente di creare potenti applicazioni OCR per la maggior parte delle attività di scansione e riconoscimento del testo quotidiane. L’analisi più avanzata di elaborazione delle immagini e struttura dei documenti viene eseguita in alcune righe di codice, consentendo di concentrarti sul business piuttosto che su algoritmi matematici complessi, reti neurali e altre complessità tecniche.

Foto OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Crea un PDF ricercabile dalla scansione

PDF è uno dei formati più popolari per la scansione di documenti cartacei, in particolare per la sua capacità di combinare più pagine in un singolo file. Questo formato è ampiamente utilizzato per lo scambio di contratti, fatture, documenti legali, passaporti e carte d’identità e molti altri documenti tra individui, imprese, banche e agenzie governative. Tuttavia, qualsiasi PDF scansionato è essenzialmente una raccolta di immagini. Non contiene testo leggibile dalla macchina, quindi gli utenti non possono cercare, copiare o manipolare altrimenti il contenuto del documento.

Aspone .NET OCR ti offre un modo veloce, facile e altamente affidabile per convertire qualsiasi PDF scansionato in un documento completamente ricercabile e indicizzabile. Riconosce accuratamente il contenuto di pagina, convertendolo in un livello di testo leggibile dalla macchina sull’immagine originale che può essere selezionato, copiato, letta da software text-to-speech e persino elaborato automaticamente da traduttori, sommari e altri strumenti di analisi basati sull’intelligenza artificiale.

Aggiungi il testo di testo a PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Cerca il testo nelle immagini

Gli archivi digitali, in particolare nelle grandi organizzazioni, consistono spesso in una vasta collezione di scansioni e foto, molte delle quali possono contenere documenti multi-pagine. La gestione efficiente e l’organizzazione di tali archivi sono efficacemente essenziali per un facile recupero e navigazione delle informazioni. Tuttavia, le immagini non contengono un testo leggibile dalla macchina, rendendo impossibile cercare e analizzare il contenuto del documento.

La libreria OCR C# ti consente di cercare facilmente il testo nelle immagini, indipendentemente dal carattere, dalla dimensione del testo, dallo stile e da altri parametri. La biblioteca supporta anche ricerche insensibili al caso e espressioni regolari, che sono estremamente utili in varie applicazioni e settori. Questa funzionalità può essere utilizzata per classificare i documenti in base al contenuto, alle parole chiave o ai modelli presenti nel testo; Alla ricerca di termini o clausole specifiche all’interno di accordi e contratti; riorganizzare i file in base a parole chiave o contenuti trovati al loro interno; Individua e identifica i dati personali all’interno dei documenti, rendendo più semplice garantire la conformità del GDPR e gestire le informazioni sensibili in modo più efficace. La ricerca di immagini withing consente anche di creare flussi di lavoro automatizzati e semplificare vari processi aziendali al momento della ricezione di contratti e fatture firmate.

Cerca il testo nelle immagini - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

AI Postprocessing con LLM

Ora puoi andare oltre il riconoscimento grezzo e applicare la logica guidata dall’IA per migliorare la qualità testuale dei risultati OCR. I modelli di linguaggio di grandi dimensioni (LLM) possono correggere in modo intelligente gli errori di ortografia, ripristinare i confini delle parole, applicare le regole della grammatica e adattare il testo in base al contesto, cosa che non può fare i controlli degli ortisti basati sulla sintassi.

Questo passaggio di postprocessing è ideale per scansioni di bassa qualità, foto con rumore di fondo o documenti multilingui. È possibile collegare qualsiasi pipeline LLM che supporti input/output di testo di base o utilizzare gli strumenti di correzione intelligente integrati per ottenere risultati pronti per la produzione.

🧠Ai Postprocessing con LLM - C#

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();