Maîtrise de l’OCR en Python : optimisé par Aspose.OCR pour Python via .NET
OCR : transformer des images en texte avec Python
Plus de vitrines ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Pourquoi opter pour Aspose.OCR pour Python via .NET ?
Embarquez pour un voyage avec Aspose.OCR pour Python via .NET – une API OCR polyvalente et conviviale. Intégrez la fonctionnalité OCR dans vos applications Python avec moins de 5 lignes de code, éliminant ainsi le besoin de réseaux mathématiques ou neuronaux complexes. Notre puissant moteur OCR offre une vitesse et une précision inégalées, prenant en charge plus de 130 langues, notamment les scripts latin, cyrillique, arabe, persan, indien et chinois. Qu’il s’agisse d’images numérisées, de photos de smartphone, de captures d’écran ou de PDF numérisés, obtenez des résultats dans des formats d’échange de documents et de données courants. Tirez parti des filtres de prétraitement pour gérer les images pivotées, asymétriques et bruitées. Optimisez les performances de reconnaissance et la charge du système en déchargeant les tâches gourmandes en ressources vers le backend .NET.
Maîtrise OCR efficace et précise
Bénéficiez d'une vitesse et d'une précision inégalées dans les résultats OCR grâce à la technologie avancée Python et .NET.
Excellence multilingue
Reconnaissez du texte dans plus de 130 langues, couvrant les écritures latines, cyrilliques et chinoises avec facilité et précision.
Traitement d'image adaptable
Traitez sans effort des images provenant de diverses sources (scanners, appareils photo et smartphones) à l'aide de Python et .NET.
Maîtrise des caractères chinois
Obtenez une reconnaissance précise de plus de 6 000 caractères chinois, garantissant l’exactitude avec Python et .NET.
Préservation des styles et formats de police
Conservez les styles de police et le formatage pour une représentation précise du texte, améliorant ainsi la polyvalence avec Python et .NET.
Exemple de code en direct
Découvrez la simplicité : convertissez une image en texte en seulement trois lignes de code Python !
* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez notre Conditions d'utilisation et politique de confidentialité.
Convertir l'image en texte
Découvrez plus d'exemples ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Choisissez votre préférence
Choisissez la bibliothèque adaptée à vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.
Polyvalence
Python via .NET
Uniformité
Python via Java
Performance
Python via C++
L’autonomisation .NET pour Python dans tous les coins
Aspose.OCR pour Python via .NET fonctionne de manière transparente sur n’importe quelle plate-forme prenant en charge .NET Framework 4.0 et versions ultérieures – qu’il s’agisse d’une machine locale, d’un site Web serveur ou le cloud.
Formats de fichiers pris en charge
Aspose.OCR for Python via .NET peut fonctionner avec pratiquement n’importe quel fichier vous pouvez l’obtenir à partir d’un scanner ou d’un appareil photo. Les résultats de la reconnaissance sont renvoyés dans les formats d’échange de fichiers et de données les plus courants qui peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.
Images
- JPEG
- PNG
- TIFF
- BMP
- GIF
ROC par lots
- Multi-page PDF
- DjVu
- ZIP
- Folder
Résultats de reconnaissance
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation pour Python avec backend .NET
Aspose.OCR pour Python via .NET est fourni sous forme de package Python avec des dépendances minimales ou sous forme de fichier téléchargeable . Installez-le facilement dans votre projet et vous êtes prêt à reconnaître des textes dans plusieurs langues prises en charge et à enregistrer les résultats de la reconnaissance dans différents formats.
Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle et sans limitations.
OCR puissant pour les applications Python
Notre bibliothèque s’intègre facilement, permettant aux applications Python de s’exécuter de manière transparente sur n’importe quelle plateforme : ordinateur de bureau Windows, Windows Server, macOS, Linux et cloud.
Plus de 130 langues de reconnaissance
Notre API Python et .NET OCR reconnaît une multitude de langages et de scripts d’écriture populaires, y compris des langages mixtes :
Laissez la détection de langue à la bibliothèque ou définissez la langue vous-même pour des performances et une fiabilité de reconnaissance améliorées.
- Alphabet latin étendu : anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et plus de 80 autres ;
- Alphabet cyrillique : russe, ukrainien, kazakh, serbe, biélorusse, bulgare ;
- arabe, persan, ourdou ;
- Écriture chinoise et devanagari, notamment hindi, marathi, bhojpuri et autres.
Filtres de traitement puissants
La précision et la fiabilité de la reconnaissance optique des caractères dépendent fortement de la qualité de l’image originale. Aspose.OCR pour Python via .NET propose un grand nombre de filtres de traitement d’image entièrement automatisés et manuels qui améliorent une image avant qu’elle ne soit envoyée au moteur OCR :
- Redressez automatiquement les images alignées selon un léger angle par rapport à l’horizontale.
- Faites pivoter manuellement les images fortement asymétriques.
- Supprimez automatiquement la saleté, les taches, les rayures, les reflets, les dégradés indésirables et autres bruits.
- Ajustez automatiquement le contraste de l’image.
- Mise à l’échelle automatique ou redimensionnement manuel de l’image.
- Convertissez les images en noir et blanc ou en niveaux de gris.
- Inversez les couleurs de l’image afin que les zones claires apparaissent sombres et les zones sombres apparaissent claires.
- Augmentez l’épaisseur des caractères dans une image.
- Floutez les images bruyantes tout en préservant les bords des lettres.
- Redressez la courbure de la page et corrigez la distorsion de l’objectif de l’appareil photo pour les photos de la page.
Optimisé pour des types de documents spécifiques
Aspose.OCR pour Python via .NET propose des réseaux de neurones spécialement entraînés pour extraire le texte de certains types d’images avec une précision maximale :
Correcteur orthographique intégré
Bien qu’Aspose.OCR pour Python via .NET offre une précision de reconnaissance élevée, des défauts d’impression, de la saleté ou des polices non standard peuvent entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer le correcteur orthographique, qui recherche et corrige automatiquement les fautes d’orthographe en fonction de la langue de reconnaissance sélectionnée.
Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires orthographiques courants, vous pouvez fournir vos propres listes de mots.
Reconnaissance par lots simplifiée
Notre API Python OCR vous libère de la reconnaissance des images une par une. Utilisez diverses méthodes de traitement par lots pour reconnaître plusieurs images en un seul appel :
- Reconnaissance des fichiers PDF, TIFF et DjVu multipages.
- Reconnaissance de tous les fichiers d’un dossier.
- Reconnaissance de tous les fichiers d’une archive.
- Reconnaissance de tous les fichiers d’une liste.
Apprendre grâce à des exemples Python
Aspose.OCR pour Python via .NET fournit un tableau d’ exemples écrits en Python, vous permettant de vous familiariser rapidement avec ses fonctions et capacités. Obtenez des informations pour créer des solutions sur mesure pour répondre aux besoins de votre entreprise Python.
Caractéristiques et capacités
Aspose.OCR for Python via .NET Explorez les fonctionnalités avancées d’Aspose.OCR pour C++.
ROC de photos
Extrayez le texte des photos de votre smartphone avec une précision de niveau numérisation.
PDF consultable
Convertissez n’importe quelle numérisation en un document entièrement consultable et indexable.
Reconnaissance d’URL
Reconnaissez une image à partir d’une URL sans la télécharger localement.
Reconnaissance groupée
Lisez toutes les images de documents, dossiers et archives de plusieurs pages.
N’importe quelle police et style
Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.
Affiner la reconnaissance
Ajustez chaque paramètre OCR pour obtenir les meilleurs résultats de reconnaissance.
Correcteur orthographique
Améliorez les résultats en corrigeant automatiquement les mots mal orthographiés.
Rechercher du texte dans les images
Recherchez du texte ou une expression régulière dans un ensemble d’images.
Comparer les textes des images
Comparez les textes sur deux images, quels que soient la casse et la mise en page.
Exemples de code Python
Plongez dans des exemples de code pour intégrer de manière transparente Aspose.OCR pour Python via .NET dans vos applications Python.
Maîtrise de l’installation en Python
Distribué sous forme de roue Python ou de package téléchargeable autonome, Aspose.OCR pour Python via .NET est facilement distribué. L’intégration dans votre projet Python, directement à partir de votre environnement de développement intégré (IDE) Python préféré, est un processus transparent. Installez-le simplement et vous êtes prêt à exploiter la gamme complète des fonctionnalités OCR, en enregistrant les résultats de reconnaissance dans différents formats.
Après l’installation, vous pouvez rapidement commencer à utiliser Aspose.OCR pour Python via .NET. , mais avec certaines limites. Une licence temporaire lève toutes les restrictions de la version d’essai pendant 30 jours. Profitez de cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée concernant l’achat d’Aspose.OCR pour Python via .NET à un stade ultérieur.
Charger la licence
lic = License()
lic.set_license(self.licPath)
Reconnaître le texte sur les photos
Lire du texte à partir de n’importe quel contenu dans Aspose.OCR pour Python via .NET est aussi simple que d’appeler une méthode universelle reconnu ().
Convertir une photo en texte - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Convertisseur universel Python
Notre API lit habilement n’importe quelle image provenant de scanners, d’appareils photo ou de smartphones : documents PDF, JPEG, PNG, TIFF, GIF, images BMP et même fichiers DjVu. La prise en charge complète des documents PDF de plusieurs pages, des images TIFF et DjVu garantit la polyvalence. Vous pouvez également fournir une image du Web via une URL.
Les résultats de la reconnaissance sont renvoyés dans des formats d’échange de documents et de données courants : texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.
Reconnaître le PDF et enregistrer les résultats dans différents formats de sortie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimisation des ressources en Python
La reconnaissance optique de caractères nécessite des ressources. Notre API offre des moyens flexibles d’équilibrer la triade classique temps-prix-qualité :
- Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
- Spécifiez le nombre de threads alloués pour la reconnaissance ou autorisez la bibliothèque à s'adapter automatiquement au nombre de cœurs de processeur.
- Libérez le processeur en déchargeant les calculs vers le backend .NET.
Reconnaissance rapide - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Reconnaître une seule ligne
Si votre image est déjà découpée en une seule ligne de texte, elle peut être reconnue le plus rapidement possible, sans corrections automatisées, détection de la structure du contenu et autres étapes gourmandes en ressources. Il peut accélérer l’OCR jusqu’à 7 fois plus vite que le processus de reconnaissance normal.
Reconnaître une seule ligne de texte sur une image - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)