Bibliothèque OCR Python
Convertissez des images en texte avec Python OCR
Plus de vitrines ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Pourquoi Aspose.OCR pour Python via .NET ?
Embarquez pour un voyage avec Aspose OCR pour Python via .NET – une API OCR polyvalente et conviviale. Intégrez la fonctionnalité OCR dans vos applications Python avec moins de 5 lignes de code, éliminant ainsi le besoin de réseaux mathématiques ou neuronaux complexes. Notre puissant moteur OCR offre une vitesse et une précision inégalées, prenant en charge plus de 130 langues, dont l’anglais, le cyrillique, l’arabe, le persan, l’hindi, le chinois, le japonais, le coréen, le tamoul et bien d’autres. Qu’il s’agisse d’images numérisées, de photos de smartphone, de captures d’écran ou de PDF numérisés, obtenez des résultats dans des formats d’échange de documents et de données courants. Tirez parti des filtres de prétraitement pour gérer les images pivotées, asymétriques et bruitées.
OCR efficace et précis
Bénéficiez d'une vitesse et d'une précision inégalées dans les résultats OCR grâce à la technologie Python avancée.
Multilingue
Reconnaissez du texte dans plus de 140 langues : anglais, français, allemand, espagnol, russe, chinois, hindi, japonais, coréen, tamoul, arabe, persan, etc.
Universel
Traitez sans effort des images provenant de diverses sources (scanners, appareils photo et smartphones) à l'aide de Python.
langues asiatiques
Obtenez une reconnaissance précise des écritures chinoises, arabes, dévanagari et dravidiennes, ainsi que des textes en langues mixtes.
Conserver la mise en page
Conservez le formatage source pour une représentation précise du texte et reconnaissez les tableaux.
Exemple de code en direct
Convertissez une image en texte en seulement TROIS lignes de code Python. Essayez par vous-même !
* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez notre Conditions d'utilisation et politique de confidentialité.
Convertir l'image en texte
Découvrez plus d'exemples ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Choisissez votre préférence
Choisissez la bibliothèque adaptée à vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.
Versatilité
Python via .NET
Uniformité
Python via Java
Performance
Python via C++
Fonctionne partout
Quel que soit son nom, Aspose.OCR pour Python via .NET ne nécessite pas l’installation de .NET sur la plateforme cible. Le package d’installation est déjà livré avec tous les composants requis et peut fonctionner de manière transparente sur n’importe quelle plate-forme, qu’il s’agisse d’une machine locale, d’un serveur Web ou du cloud.
Formats de fichiers pris en charge
Aspose.OCR for Python via .NET peut fonctionner avec n’importe quel fichier vous pouvez l’obtenir à partir d’un scanner ou d’un appareil photo. Les résultats de la reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.
Images
- JPEG
- PNG
- TIFF
- BMP
- GIF
ROC par lots
- Multi-page PDF
- DjVu
- ZIP
- Folder
Résultats de reconnaissance
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation
Aspose.OCR pour Python via .NET est fourni sous forme de package Python avec des dépendances minimales ou sous forme de fichier téléchargeable ou de [package PyPI](https : //pypi.org/project/aspose-ocr-python-net/). Installez-le facilement dans votre projet et vous êtes prêt à reconnaître des textes dans plus de 140 langues et à enregistrer les résultats de la reconnaissance dans différents formats.
Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle et sans limitations.
OCR sous Python
Notre bibliothèque s’intègre facilement, permettant aux applications Python de s’exécuter de manière transparente sur n’importe quelle plateforme : ordinateur de bureau Windows, Windows Server, macOS, Linux et cloud.
Plus de 140 langues de reconnaissance
Notre bibliothèque Java OCR est une solution universelle pour le traitement de documents, l’extraction de données et la numérisation de contenu à l’échelle mondiale. Prenant en charge une vaste gamme de scripts d’écriture européens, du Moyen-Orient et d’Asie, il est bien adapté à tous les pays et à toutes les entreprises.
Aspose OCR pour Java reconnaît le texte dans les documents multilingues, tels que chinois/anglais, arabe/français ou cyrillique/anglais. Les langues suivantes sont prises en charge :
- Latin étendu : anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et plus de 80 autres ;
- Alphabet cyrillique : russe, ukrainien, kazakh, bulgare, y compris des textes mixtes cyrillique/anglais ;
- arabe, persan, ourdou, y compris des textes mélangés à de l’anglais ;
- Langues chinoise, coréenne, japonaise, devanagari et dravidienne, dont l’hindi, le tamoul, le marathi et d’autres. Les textes en langues mixtes sont également pris en charge.
Filtres de traitement puissants
La précision et la fiabilité de la reconnaissance optique des caractères dépendent fortement de la qualité de l’image originale. Aspose OCR for Python via .NET propose un grand nombre de filtres de traitement d’image entièrement automatisés et manuels qui améliorent une image avant qu’elle ne soit envoyée au moteur OCR :
- Faites pivoter automatiquement les images inversées et pivotées.
- Détectez les images inversées et extrayez le texte blanc sur noir.
- Supprimez automatiquement la saleté, les taches, les rayures, les reflets, les dégradés indésirables et autres bruits.
- Ajustez automatiquement le contraste de l’image.
- Mise à l’échelle automatique ou redimensionnement manuel de l’image.
- Convertissez les images en noir et blanc ou en niveaux de gris.
- Trouver les zones d’image potentiellement problématiques et renvoyer les informations sur le type de défaut et ses coordonnées.
- Augmentez l’épaisseur des caractères dans une image.
- Floutez les images bruyantes tout en préservant les bords des lettres.
- Redressez la courbure de la page et corrigez la distorsion de l’objectif de l’appareil photo pour les photos de la page.
Optimisé pour des types de documents spécifiques
Aspose OCR pour Python via .NET propose des réseaux de neurones spécialement entraînés pour extraire le texte de certains types d’images avec une précision maximale :
Correcteur orthographique intégré
Bien que notre bibliothèque Python OCR offre une précision de reconnaissance élevée, des défauts d’impression, de la saleté ou des polices non standard peuvent entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer le correcteur orthographique, qui recherche et corrige automatiquement les fautes d’orthographe en fonction de la langue de reconnaissance sélectionnée.
Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires orthographiques courants, vous pouvez fournir vos propres listes de mots.
Reconnaissance par lots
Notre API Python OCR vous libère de la reconnaissance des images une par une. Utilisez diverses méthodes de traitement par lots pour reconnaître plusieurs images en un seul appel :
- Reconnaissance des fichiers PDF, TIFF et DjVu multipages.
- Reconnaissance de tous les fichiers d’un dossier.
- Reconnaissance de tous les fichiers d’une archive.
- Reconnaissance de tous les fichiers d’une liste.
Apprentissage par échantillon
OCR pour Python fournit un tableau d’ exemples écrits en Python, vous permettant de vous familiariser rapidement avec ses fonctions et capacités. Obtenez des informations pour créer des solutions sur mesure pour répondre aux besoins de votre entreprise Python.
Caractéristiques et capacités
Aspose.OCR for Python via .NET résout vos tâches rapidement et facilement.
ROC de photos
Extrayez le texte des photos de votre smartphone avec une précision de niveau numérisation.
PDF consultable
Convertissez n’importe quelle numérisation en un document entièrement consultable, indexable et modifiable.
Reconnaissance d’URL
Reconnaissez une image à partir d’une URL sans la télécharger localement.
Reconnaissance groupée
Lisez toutes les images de documents, dossiers et archives de plusieurs pages.
N’importe quelle police et style
Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.
Affiner la reconnaissance
Ajustez chaque paramètre OCR pour obtenir les meilleurs résultats de reconnaissance.
Correcteur orthographique
Améliorez les résultats en corrigeant automatiquement les mots mal orthographiés.
Rechercher du texte dans les images
Recherchez du texte ou une expression régulière dans un ensemble d’images.
Comparer les textes des images
Comparez les textes sur deux images, quels que soient la casse et la mise en page.
Exemples de code Python
Plongez dans des exemples de code pour intégrer de manière transparente l’OCR dans vos applications Python.
Installation
Distribué sous forme de roue Python ou de package téléchargeable autonome, Aspose.OCR pour Python via .NET est facilement distribué. L’intégration dans votre projet Python, directement à partir de votre environnement de développement intégré (IDE) Python préféré, est un processus transparent. Installez-le simplement et vous êtes prêt à exploiter la gamme complète des fonctionnalités OCR, en enregistrant les résultats de reconnaissance dans différents formats.
Après l’installation, vous pouvez rapidement commencer à utiliser Aspose.OCR pour Python via .NET. , mais avec certaines limites. Une licence temporaire lève toutes les restrictions de la version d’essai pendant 30 jours. Profitez de cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée concernant l’achat d’Aspose.OCR pour Python via .NET à un stade ultérieur.
Charger la licence
lic = License()
lic.set_license(self.licPath)
Reconnaître le texte sur les photos
Lire du texte à partir de n’importe quel contenu dans Aspose OCR pour Python est aussi simple que d’appeler une méthode de reconnaissance universelle.
Convertir une photo en texte - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Convertisseur universel Python
Notre API lit habilement n’importe quelle image provenant de scanners, d’appareils photo ou de smartphones : documents PDF, JPEG, PNG, TIFF, GIF, images BMP et même fichiers DjVu. La prise en charge complète des documents PDF de plusieurs pages, des images TIFF et DjVu garantit la polyvalence. Vous pouvez également fournir une image du Web via une URL.
Les résultats de la reconnaissance sont renvoyés dans des formats d’échange de documents et de données courants : texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.
Reconnaître le PDF et enregistrer les résultats dans différents formats de sortie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimisation des ressources en Python
La reconnaissance optique de caractères nécessite des ressources. Notre API offre des moyens flexibles d’équilibrer la triade classique temps-prix-qualité :
- Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
- Spécifiez le nombre de threads alloués pour la reconnaissance ou autorisez la bibliothèque à s'adapter automatiquement au nombre de cœurs de processeur.
- Libérez le processeur en déchargeant les calculs vers le backend .NET.
Reconnaissance rapide - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Reconnaître une seule ligne
Si votre image est déjà découpée en une seule ligne de texte, elle peut être reconnue le plus rapidement possible, sans corrections automatisées, détection de la structure du contenu et autres étapes gourmandes en ressources. Il peut accélérer l’OCR jusqu’à 7 fois plus vite que le processus de reconnaissance normal.
Reconnaître une seule ligne de texte sur une image - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)