OCR for C++

OCR for Python via .NET

OCR for Python via Java

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for .NET

Bibliothèque C # OCR à alimentation AI pour .NET

La bibliothèque .net OCR prenant en charge 140+ langages de reconnaissance qui extrait du texte des images et crée des PDF consultables avec seulement quelques lignes de code C #.

Télécharger Procès Achat

Voyez ce qui est nouveau

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
     = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

> dotnet add package Aspose.OCR

Pourquoi choisir Aspose OCR Library?

Créez des capacités OCR puissantes dans vos applications .NET en quelques secondes. Notre API OCR facile à utiliser vous permet d’extraire du texte des images et des analyses, créez des PDF consultables, et plus encore avec un code C # minimal. Idéal pour les fonctions de bureau .NET, Web, cloud et sans serveur.
Expérience de l’OCR qui n’extrait pas seulement du texte, mais qui le comprend et l’améliore avec l’IA. Cliquez sur les éléments ci-dessous pour en savoir plus sur nos fonctionnalités et avantages.

Applications Global OCR

C # OCR reconnaît l'anglais, le cyrillique, l'arabe, le persan, le chinois, le japonais, les coréens, l'hindi, le tamoul et les textes de langue mixte.

Lisez tout

Obtenez du texte à partir de tout fichier obtenu via un scanner ou une caméra et traiter les images directement à partir des liens Web.

Résultats fiables

Atteignez une précision de reconnaissance élevée pour toutes les images, y compris celles qui sont hors de portée, tournées, déformées et bruyantes.

Reconnaissance par lots

Reconnaître en vrac toutes les images des dossiers et des archives; Lisez des documents PDF de plusieurs pages et des images TIFF.

Détection de disposition

Identifiez et catégorisez les blocs de contenu dans les images pour assurer l'ordre correct du texte extrait, quelle que soit la mise en page.

Post-traitement de l'IA à l'aide de LLMS

Pas seulement OCR - votre solution d'IA tout-en-un pour la reconnaissance de texte plus intelligente et sans erreur. Aspose.ocr intègre désormais l'IA et les LLM pour choisir des modèles qui améliorent considérablement la précision de l'OCR - les erreurs de fixe, la restauration du texte manquant et l'amélioration de la qualité de reconnaissance globale.

Exemple de code en direct

.NET OCR devient une tâche triviale et simple avec Aspose OCR API, même pour les nouveaux développeurs. Quelques lignes de code suffisent à extraire du texte d’une image et à l’afficher à l’écran. C’est vraiment aussi simple - essayez-le.

Prêt à reconnaître Prêt à reconnaître Déposez un fichier ici ou cliquez pour parcourir *

* En téléchargeant vos fichiers ou en utilisant le service avec lequel vous êtes d'accord avec notre Conditions d'utilisation et politique de confidentialité.

Résultat de reconnaissance

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Indépendance de la plate-forme

La bibliothèque OCR de plate-forme peut fonctionner partout sous .NET, .NET Core ou .NET Framework - que ce soit sur une machine locale, sur le serveur Web ou dans le cloud.

Formats de fichiers pris en charge

Aspose.OCR for .NET peut fonctionner avec n’importe quel fichier Vous pouvez obtenir à partir d’un scanner ou d’une caméra. Les résultats de reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.

Images

JPEG
PNG
TIFF
BMP
GIF

OCR par lots

Multi-page PDF
DjVu
ZIP
Folder

Résultats de la reconnaissance

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

OCR alimenté par LLM: La prochaine génération d’OCR entraînée par les modèles de langue AI.

La précision des résultats ne s’arrête pas à la reconnaissance - déverrouillez le niveau suivant de qualité en affinant du texte à l’aide de LLM externes.

Corriger automatiquement l’orthographe et la grammaire dans le texte reconnu.
Normaliser les incohérences et les problèmes de formatage entre les analyses de plusieurs pages.
Adapter les résultats de reconnaissance au vocabulaire spécifique au sujet à l’aide de modèles invités.
Intégrez n’importe quel pipeline LLM externe dans votre flux de travail OCR avec seulement quelques lignes de code.

Adapté à tout contenu

La précision et la fiabilité de la reconnaissance de texte en C # dépendent en grande partie de la qualité de l’image. .NET OCR offre un ensemble complet d’optimisation automatisée et manuelle d’image, garantissant des résultats de reconnaissance supérieurs.

Un traitement d’image puissant, une détection de texte entièrement personnalisable, un post-traitement et une correction d’orthographe automatisée permettent l’extraction de texte à partir de tout scan ou photo avec une précision la plus élevée.

Optimisation des ressources de l’OCR

La bibliothèque ASPOSE ‘C # OCR permet un équilibrage très flexible de la vitesse de reconnaissance, de la qualité et de l’utilisation des ressources pour chaque cas d’utilisation spécifique:

Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
Spécifiez le nombre de threads alloués à la reconnaissance ou permettez à notre bibliothèque .NET OCR de se mettre automatiquement à évoluer au nombre de cœurs de processeur.
Libérez le CPU en déchargeant les calculs au GPU.

140+ langues de reconnaissance

Notre bibliothèque C # OCR est une solution universelle pour le traitement des documents, l’extraction des données et la numérisation du contenu à l’échelle mondiale. Avec le soutien à une vaste gamme de scripts d’écriture européens, du Moyen-Orient et d’Asie, il est bien adapté pour tout pays et entreprise.

Vous pouvez reconnaître des documents écrits en langues mixtes, telles que chinois / anglais, arabe / français ou cyrillique / anglais. Les langues suivantes sont prises en charge:

** Latin étendu **: anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et 80+ de plus;
** Cyrillic ** Alphabet: russe, ukrainien, kazakh, bulgare, y compris les textes cyrilliques / anglais mixtes;
Arabe, persan, ourdou, y compris des textes mélangés à l’anglais;
Les langues chinoises, coréennes, japonaises, Devanagari et Dravidiens, y compris l’hindi, le tamoul, le marathi et autres.

Caractéristiques et capacités

C # OCR extrait automatiquement le texte des photos ou des analyses, éliminant le besoin de repection manuelle de documents.

Photo OCR

Extraire le texte des photos du smartphone avec précision au niveau scan.

PDF consultable

Convertissez toute analyse en document entièrement consultable et indexable.

Reconnaissance de l’URL

Reconnaissez une image de l’URL sans la télécharger localement.

Reconnaissance en vrac

Lisez toutes les images de documents, dossiers et archives de plusieurs pages.

Toute police et style

Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.

Reconnaissance de tonnelle

Ajustez chaque paramètre OCR pour les meilleurs résultats de reconnaissance.

Vérificateur orthographique

Améliorer les résultats en corrigeant automatiquement les mots mal orthographiés.

Trouver du texte dans les images

Recherchez du texte ou de l’expression régulière dans un ensemble d’images.

Comparez les textes de l’image

Comparez les textes sur deux images, quel que soit le cas et la mise en page.

Correction alimentée par AI

Corrigez les mots et la grammaire mal reconnus à l’aide de LLMS basés sur le transformateur - aucune formation personnalisée requise.

Post-procédure sémantique

Allez au-delà des caractères: affinez la sortie OCR bruyante avec des LLM pour une meilleure qualité de contenu et une normalisation du langage.

Pipelines LLM plug-in

Connectez les modèles de langage externe pour corriger les erreurs de reconnaissance OCR et restaurer du texte incomplet ou fragmenté.

OCR facile à utiliser

Avec notre API C # OCR, vous n’avez besoin que de quelques lignes de code C # pour convertir l’image en texte, créer un PDF consultable, enregistrer les résultats de reconnaissance à documenter, et bien d’autres. Explorez les échantillons de code pour comprendre comment intégrer notre API OCR dans vos solutions .NET.

Installation

.NET OCR est distribué en tant que Package NuGet ou comme un fichier téléchargeable avec des dépendances minimales. Le package peut être ajouté à votre projet directement à partir de Microsoft Visual Studio. Installez-le simplement sur votre projet et vous êtes prêt à extraire du texte des images et à enregistrer les résultats de reconnaissance dans l’un des formats pris en charge. Si votre système dispose d’un GPU capable CUDA, vous pouvez utiliser le GPU-Accelerated OCR Engine pour augmenter considérablement les performances de reconnaissance.

Vous pouvez commencer à utiliser Aspose.OCR for .NET juste après l’installation avec certaines restrictions . Une licence temporaire supprime toutes les limites de la version d’essai pendant 30 jours. Utilisez-le pour commencer à construire une application OCR entièrement fonctionnelle et à prendre la décision finale d’acheter l’OCR pour .NET plus tard.

Extraire du texte d’une photo

Lorsque les gens pensent généralement à l’OCR (reconnaissance des caractères optiques), la première association est souvent avec un scanner comme dispositif de capture principal. Cette association a des raisons historiques et est toujours répandue dans de nombreux contextes, fournissant un environnement cohérent et contrôlé pour capturer du texte imprimé à partir de documents physiques avec une qualité inégalée. Cependant, un scanner est un équipement spécialisé qui n’est pas toujours à portée de main et nécessite un poste de travail stationnaire pour fonctionner. Heureusement, le monde moderne offre une alternative pratique aux scanners traditionnels - une caméra pour smartphone. Les progrès de la technologie de la caméra pour smartphone garantissent que même un smartphone d’entrée de gamme offre une qualité suffisante pour capturer des documents prêts pour l’OCR. Et la mémoire intégrée facilite que jamais la numérisation de grandes quantités de documents, journaux, livres, panneaux de signalisation et autres texte en déplacement. Tout ce dont vous avez besoin est la bonne technologie pour convertir ces photos en texte lisible par machine.

Notre bibliothèque C # OCR est spécialement conçue pour reconnaître tous les types d’images prêtes à l’emploi et peut être encore affinée pour gérer même les photos de faible qualité. Combiné avec un smartphone moderne, il vous permet de créer des applications OCR puissantes pour la plupart des tâches quotidiennes de numérisation et de reconnaissance de texte. Le traitement d’image le plus avancé et l’analyse de la structure des documents sont effectués dans quelques lignes de code, vous permettant de vous concentrer sur les affaires plutôt que sur des algorithmes mathématiques complexes, des réseaux de neurones et d’autres subtilités techniques.

Photo OCR - C #

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Créer un PDF consultable à partir de l’analyse

Le PDF est l’un des formats les plus populaires pour la numérisation des documents papier, en particulier en raison de sa capacité à combiner plusieurs pages en un seul fichier. Ce format est largement utilisé pour l’échange de contrats, factures, documents juridiques, passeports et cartes d’identité, et de nombreux autres documents entre les particuliers, les entreprises, les banques et les agences gouvernementales. Cependant, tout PDF numérisé est essentiellement une collection d’images. Il ne contient pas de texte lisible par machine, les utilisateurs ne peuvent donc pas rechercher, copier ou autrement manipuler le contenu du document.
Aspose .NET OCR vous offre un moyen rapide, facile et très fiable de convertir n’importe quel PDF numérisé en un document entièrement consultable et indexable. Il reconnaît avec précision le contenu de la page, le convertissant en une couche de texte lisible par machine sur l’image d’origine qui peut être sélectionnée, copiée, lue par logiciel de texte vocal, et même traitée automatiquement par des traducteurs, des résumurs et d’autres outils d’analyse alimentés par AI.

Ajouter une superposition de texte à PDF - C #

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Rechercher du texte en images

Les archives numériques, en particulier dans les grandes organisations, consistent souvent en une vaste collection de scans et de photos, dont beaucoup peuvent contenir des documents de plusieurs pages. La gestion et l’organisation efficaces de ces archives sont essentiellement essentielles pour la récupération et la navigation faciles de l’information. Cependant, les images ne contiennent pas de texte lisible par machine, ce qui rend impossible la recherche et l’analyse du contenu du document.

La bibliothèque C # OCR vous permet de rechercher facilement du texte dans les images, quelle que soit la police, la taille du texte, le style et d’autres paramètres. La bibliothèque prend également en charge les recherches insensibles à des cas et les expressions régulières, qui sont extrêmement utiles dans diverses applications et industries. Cette fonctionnalité peut être utilisée pour catégoriser les documents en fonction du contenu, des mots clés ou des modèles trouvés dans le texte; rechercher des conditions ou des clauses spécifiques dans les accords et les contrats; réorganiser des fichiers basés sur des mots clés ou un contenu trouvés en eux; Localisez et identifiez les données personnelles dans les documents, ce qui facilite la conformité au RGPD et gérer les informations sensibles plus efficacement. La recherche d’images avec des images permet également de créer des workflows automatisés et de rationaliser divers processus métier lors de la réception de contrats et de factures signées.

Rechercher du texte dans les images - C #

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

Ai post-traitement avec LLM

Vous pouvez désormais aller au-delà de la reconnaissance brute et appliquer la logique axée sur l’IA pour améliorer la qualité textuelle des résultats de l’OCR. Les modèles de grands langues (LLM) peuvent intelligemment corriger les erreurs d’orthographe, restaurer les limites des mots, appliquer des règles de grammaire et adapter le texte en fonction du contexte - quelque chose que les vérificateurs orthographiques basés sur la syntaxe ne peuvent pas faire.

Cette étape de post-traitement est idéale pour les analyses de basse qualité, les photos avec bruit de fond ou les documents multilingues. Vous pouvez brancher n’importe quel pipeline LLM qui prend en charge l’entrée / sortie de texte de base, ou utiliser les outils de correction intelligente intégrés d’Aspose pour obtenir des résultats prêts pour la production.

🧠ai postproessage avec LLM - C #

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();