Aspose.OCR  for .NET

Convertir des images et des PDF en texte dans .NET

Ajoutez la reconnaissance optique de caractères (OCR) à vos applications .NET en quelques lignes de code.

  Download Free Trial
  
 

Aspose.OCR pour .NET est une API puissante mais facile à utiliser et rentable pour la reconnaissance optique de caractères. Avec lui, vous pouvez ajouter la fonctionnalité OCR à vos applications .NET en moins de 5 lignes de code sans vous soucier des mathématiques complexes, des réseaux de neurones et d'autres détails techniques. Notre expérience dans les technologies d'apprentissage automatique et nos années de développement ont abouti à un moteur OCR avec une vitesse et une précision supérieures qui prend en charge 26 langues basées sur des scripts latins et cyrilliques ainsi que sur le chinois . L'API OCR peut reconnaître les images numérisées, les photos de smartphone, les captures d'écran, les zones d'images et les PDF numérisés et renvoyer les résultats dans les formats d'échange de documents et de données les plus courants. Divers filtres de prétraitement vous permettent de reconnaître les images tournées, asymétriques et bruyantes. Les performances de reconnaissance et la charge du système peuvent être encore améliorées en transférant les tâches de calcul gourmandes en ressources au GPU .

Caractéristiques et capacités d'Aspose.OCR pour .NET

Convertit les images et les PDF en texte

Prend en charge tous les formats d'image que vous pouvez obtenir à partir d'un scanner ou d'un appareil photo

Lit les langues basées sur le latin et le cyrillique

Reconnaît plus de 6 000 caractères chinois

Détecte et reconnaît toutes les polices de caractères populaires

Préserve soigneusement les styles de police et la mise en forme

Traite l'image entière ou des zones sélectionnées uniquement

Prend en charge les images tournées, asymétriques et bruyantes

Reconnaissance par lots de toutes les images d'un dossier ou d'une archive

Reconnaît les images fournies sous forme de liens Web

Recherche et corrige automatiquement les mots mal orthographiés

Entièrement compatible avec les autres produits Aspose

Facile à installer

Aspose.OCR pour .NET est distribué sous la forme d'un package NuGet léger ou sous la forme d'un fichier téléchargeable avec des dépendances minimales. Installez -le simplement dans votre projet et vous êtes prêt à reconnaître des textes dans toutes les langues prises en charge et à enregistrer les résultats de la reconnaissance dans l'un des formats pris en charge.

Demandez une licence temporaire pour commencer à créer une application OCR entièrement fonctionnelle sans aucune limite ni restriction.

Facile à utiliser

Vous avez besoin de trois lignes de code pour reconnaître l'image et afficher le résultat. Oui, c'est vraiment aussi simple que ça !

Image en texte en 3 lignes - C#

// Initialiser le moteur OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Reconnaître l'image au texte
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Afficher le résultat de la reconnaissance
Console.WriteLine(result);

Multiplateforme

La bibliothèque prend entièrement en charge .NET Standard 2.0. Cela signifie que les applications peuvent s'exécuter sur n'importe quelle plate-forme : Windows de bureau, Windows Server, macOS, Linux et cloud.

26 langues de reconnaissance

L'API OCR peut reconnaître un grand nombre de langues et tous les scripts d'écriture populaires, y compris les textes avec des langues mixtes.

  • Alphabet latin étendu : croate, tchèque, danois, néerlandais, anglais, estonien, finnois, français, allemand, italien, letton, lituanien, norvégien, polonais, portugais, roumain, slovaque, slovène, espagnol, suédois.
  • Alphabet cyrillique : biélorusse, bulgare, kazakh, russe, serbe, ukrainien.
  • Chinois : plus de 6 000 caractères.

Vous pouvez laisser la détection de la langue à la bibliothèque ou définir vous-même la langue pour augmenter les performances et la fiabilité de la reconnaissance.

Reconnaître les photos

Le plus grand obstacle aux applications OCR est que les scanners ne sont pas courants pour les utilisateurs finaux. L'API dispose de puissants filtres de prétraitement d'image intégrés qui peuvent gérer les images pivotées, asymétriques et bruyantes. En combinaison avec la prise en charge de tous les formats d'image, il permet une reconnaissance fiable même des photos de smartphone. La majeure partie du prétraitement et de la correction d'image se fait automatiquement, vous n'aurez donc à intervenir que dans les cas difficiles.

Appliquer des corrections d'image automatiques - C#

// Initialiser le moteur OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Activer le calcul automatique de l'inclinaison et le contraste
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Reconnaître l'image
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Convertisseur universel

L'API peut lire littéralement n'importe quelle image que vous pouvez obtenir à partir d'un scanner, d'un appareil photo ou d'un smartphone : documents PDF, images JPEG, PNG, TIFF, GIF, BMP et même fichiers DjVu. Les documents PDF de plusieurs pages, les images TIFF et DjVu sont entièrement pris en charge. Vous pouvez également fournir une image du Web via une URL.

Les résultats de la reconnaissance sont renvoyés dans les formats d'échange de documents et de données les plus populaires : texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.

Reconnaître le PDF et enregistrer les résultats au format JSON - C#

// Initialiser le moteur OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Reconnaître toutes les pages d'un PDF numérisé
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Sortir chaque page au format JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Optimisation des ressources

La reconnaissance optique de caractères est un processus gourmand en ressources. L'API offre des moyens très flexibles pour trouver un équilibre dans la triade classique temps-prix-qualité :

  • Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
  • Spécifiez le nombre de threads alloués pour la reconnaissance ou autorisez la bibliothèque à s'adapter automatiquement au nombre de cœurs de processeur.
  • Libérez le CPU en déchargeant les calculs sur le GPU.

Reconnaissance rapide - C#

// Initialiser le moteur OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Reconnaître l'image dans le mode le plus rapide
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Vérification orthographique

Bien que l'OCR produise des résultats fiables, la poussière et les défauts d'impression peuvent entraîner une reconnaissance incorrecte de certains symboles. L'API OCR dispose d'un correcteur orthographique intégré qui remplace automatiquement les mots mal orthographiés et vous évite d'avoir à corriger manuellement les résultats de la reconnaissance.

Vérification orthographique des résultats de reconnaissance - C#

// Initialiser le moteur OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Activer le contraste automatique
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Reconnaître l'image
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Corriger les mots mal orthographiés
string text =  result.GetSpellCheckCorrectedText();

Le traitement par lots

L'API OCR vous évite de reconnaître chaque image une par une en proposant diverses méthodes de traitement par lots qui vous permettent de reconnaître plusieurs images en un seul appel :

  • Reconnaissance des fichiers PDF, TIFF et DjVu multipages.
  • Reconnaissance de tous les fichiers d'un dossier.
  • Reconnaissance de tous les fichiers d'une archive.
  • Reconnaissance de tous les fichiers d'une liste.

Apprendre par l'exemple

Aspose.OCR pour .NET est livré avec un certain nombre d' exemples écrits en C # qui vous permettent de vous familiariser rapidement avec ses fonctions et capacités et vous donnent une idée de la création de solutions pour les besoins de votre entreprise.

  

Support and Learning Resources

  
  

Aspose propose également des API OCR natives pour d'autres langages de programmation populaires :