API de reconnaissance optique de caractères pour Python

Extrayez du texte à partir d’images numérisées, de photos et de captures d’écran, créez des fichiers PDF interrogeables, recherchez et comparez du texte dans des images, et bien plus encore à partir d’applications Python.

Aspose.OCR for Python via .NET est un moteur de reconnaissance optique de caractères (OCR) puissant et facile à utiliser pour vos applications et blocs-notes Python. En moins de 10 lignes de code, vous pouvez reconnaître du texte dans 28 langues basées sur des scripts latins, cyrilliques et asiatiques, et renvoyer les résultats dans les formats d'échange de documents et de données les plus courants. Il n'est pas nécessaire d'apprendre des modèles mathématiques complexes, de créer des algorithmes d'apprentissage automatique et de former des réseaux de neurones — notre API simple et robuste fera tout pour vous.

La bibliothèque fonctionne aussi bien avec toutes les sources, d'une numérisation de haute qualité à une photo rapide sur un smartphone. Si l'image est tournée, déformée ou bruyante — les filtres automatiques de pré- et post-traitement offrent la plus grande précision de reconnaissance dans les plus brefs délais.

En bref

Extraire du texte dans les principales langues européennes et asiatiques à partir de n’importe quel type d’image

Types d'images

Photos
Livres
Articles
Contrats
Cartes d'identité
Passeports
Reçus
Factures
Plaques d'immatriculation
et plus...

Langues prises en charge

Anglais
Chinois
Hindi
Allemand
Français
Espagnol
russe
Italien
Polonais
et plus...

Aspose.OCR

Indépendance de la plate-forme

Aspose.OCR for Python via .NET fonctionne sous Python version 3.6 ou ultérieure

Desktop OS

Windows 7
Windows 8
Windows 10
Windows 11
Linux

Server OS

Windows Server 2008
Windows Server 2012
Windows Server 2016
Windows Server 2019
Windows Server 2022

Aspose.OCR

Formats de fichiers pris en charge

Convertissez n’importe quelle image d’un scanner, d’un appareil photo ou d’Internet vers les formats d’échange de documents et de données les plus populaires

Fichiers source

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

Résultats de la reconnaissance

Searchable PDF
Microsoft Word
Microsoft Excel
EPUB
Plain text
JSON
XML

Aspose.OCR

Caractéristiques et capacités

Extraire du texte à partir de scans, de photos et de captures d'écran

Convertir des PDF numérisés en PDF indexables et indexables

Lisez les scripts latins, cyrilliques et asiatiques dans toutes les polices de caractères populaires

Reconnaître plus de 6 000 caractères chinois

Travailler avec des images floues, déformées, pivotées et bruyantes

Identifiez et préservez les blocs de contenu de la mise en page du texte d'origine

Détecter et lire les zones d'une image : paragraphes, lignes et mots simples

Traitement en masse de documents, dossiers et archives de plusieurs pages

Reconnaître les images d'Internet sans les télécharger

Identifiez et corrigez automatiquement les mots mal orthographiés

Trouvez du texte dans les images et comparez intelligemment les textes des images

Facile à utiliser

Vous n'avez besoin que de 5 lignes de code pour reconnaître l'image et afficher le résultat. Oui, c'est vraiment aussi simple que ça !

Prêt à reconnaître Reconnaître Déposez un fichier ici ou cliquez pour parcourir *

* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez nos Conditions d'utilisation et Politique de confidentialité.

Exemple de code en direct - Python 3

# Initialiser le moteur OCR
recognitionEngine = AsposeOcr()
# Ajouter une image au lot
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extraire le texte de l'image
result = recognitionEngine.recognize(input)
# Afficher le résultat de la reconnaissance
print(result[0].recognition_text)

Résultat de la reconnaissance

28 langues de reconnaissance

Aspose.OCR for Python via .NET peut reconnaître un grand nombre de langues et tous les scripts d'écriture populaires, y compris les textes avec des langues mixtes :

Alphabet latin étendu : croate, tchèque, danois, néerlandais, anglais (y compris l'écriture manuscrite), estonien, finnois, français, allemand, italien, letton, lituanien, norvégien, polonais, portugais, roumain , slovaque, slovène, espagnol, suédois.
Alphabet cyrillique : biélorusse, bulgare, kazakh, russe, serbe, ukrainien.
Chinois : plus de 6 000 caractères.
Hindi

Vous pouvez également lire des textes dans d'autres langues basées sur le latin étendu et le cyrillique, même s'ils ne sont pas directement pris en charge par le moteur OCR. Par exemple, latin, vietnamien, gaélique, etc.

Filtres de traitement puissants

La précision et la fiabilité de la reconnaissance optique des caractères dépendent fortement de la qualité de l'image originale. Aspose.OCR for Python via .NET offre un grand nombre de filtres de traitement d'image entièrement automatisés et manuels qui améliorent une image avant qu'elle ne soit envoyée au moteur OCR :

Redresser automatiquement les images légèrement inclinées par rapport à l'horizontale.
Faites pivoter manuellement les images très asymétriques.
Supprime automatiquement la saleté, les taches, les rayures, les reflets, les dégradés indésirables et tout autre bruit.
Régler automatiquement le contraste de l'image.
Agrandir automatiquement ou redimensionner manuellement l'image.
Convertissez les images en noir et blanc ou en niveaux de gris.
Inversez les couleurs de l'image afin que les zones claires apparaissent sombres et que les zones sombres apparaissent claires.
Augmenter l'épaisseur des caractères d'une image.
Floutez les images bruyantes tout en préservant les bords des lettres.
Redressez la courbure de la page et corrigez la distorsion de l'objectif de l'appareil photo pour les photos de la page.

Ces filtres peuvent être combinés et appliqués à l'ensemble de l'image ou uniquement à des zones sélectionnées de l'image, ainsi qu'en traitement par lots. Non seulement vous pouvez affiner le prétraitement dans le pipeline de reconnaissance, mais vous pouvez également stocker des images traitées pour l'affichage, la mise en cache et le débogage.

Optimisé pour des types de documents spécifiques

Aspose.OCR for Python via .NET propose des réseaux de neurones spécialement formés pour extraire le texte de certains types d'images avec une précision maximale :

Cartes d'identité et passeports numérisés ou photographiés
Plaques d'immatriculation des véhicules.
Factures.
Reçus.

Correcteur orthographique intégré

Bien que Aspose.OCR for Python via .NET fournisse une précision de reconnaissance élevée, des défauts d'impression, de la saleté ou des polices non standard peuvent entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de la reconnaissance, vous pouvez activer le correcteur orthographique, qui détecte et corrige automatiquement les fautes d'orthographe en fonction de la langue de reconnaissance sélectionnée.

Si le texte reconnu contient une terminologie spécialisée, des abréviations et d'autres mots qui ne sont pas présents dans les dictionnaires orthographiques courants, vous pouvez fournir vos propres listes de mots.

Création de PDF consultables

Même avec la plus grande précision de reconnaissance, l'image d'origine peut contenir de nombreuses informations non textuelles importantes ou simplement avoir une grande valeur historique. Aspose.OCR for Python via .NET offre une solution simple et élégante pour combiner le meilleur des deux mondes. Nous extrayons le texte d'une image, d'un document PDF ou d'un package de fichiers et le plaçons en tant que couche de texte invisible au-dessus des images d'origine. Le résultat est enregistré au format PDF, qui est la norme de l'industrie pour le stockage et le partage de documents. Les fichiers résultants peuvent être recherchés et indexés, et le texte peut être sélectionné et copié de la même manière que si vous aviez sélectionné et copié les caractères d'origine.

Reconnaissance en masse

Aspose.OCR pour Python via .NET vous permet de reconnaître plusieurs fichiers, quels que soient leur nombre et leur type, aussi simplement que de lire une seule image. Avec un seul appel d'API, vous pouvez reconnaître plusieurs pages à partir d'un scanner à alimentation automatique ou extraire les plaques d'immatriculation des véhicules à partir de caméras de circulation automatiques.

Les résultats peuvent être enregistrés sous forme de documents PDF ou de feuilles de calcul interrogeables, ou renvoyés sous forme de texte brut, JSON ou XML pour une analyse plus approfondie.

Support and Learning Resources

Ressources d'apprentissage
Documentation
Dépôt
Vidéos didactiques

Pourquoi Aspose.OCR for Python via .NET ?
Liste des clients
Réussites

Download Free Trial Pricing Information

Aspose propose également des API OCR natives pour d'autres langages de programmation populaires :

API de reconnaissance optique de caractères pour Python

Extrayez du texte à partir d’images numérisées, de photos et de captures d’écran, créez des fichiers PDF interrogeables, recherchez et comparez du texte dans des images, et bien plus encore à partir d’applications Python.

Aspose.OCR for Python via .NET

Overview

En bref

Indépendance de la plate-forme

Formats de fichiers pris en charge

Caractéristiques et capacités

Facile à utiliser

Exemple de code en direct - Python 3

28 langues de reconnaissance

Filtres de traitement puissants

Optimisé pour des types de documents spécifiques

Correcteur orthographique intégré

Création de PDF consultables

Reconnaissance en masse

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++

Aspose.OCR for.NET