Bibliothèque Python OCR
Convertir des images en texte avec Python OCR
Plus de vitrines ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Pourquoi aspose.ocr pour Python via .net?
Embarquez dans un voyage avec Aspose OCR pour Python via .NET - une API OCR polyvalente et conviviale. Intégrez la fonctionnalité OCR dans vos applications Python avec moins de 5 lignes de code, éliminant le besoin de mathématiques ou de réseaux de neurones complexes. Notre puissant moteur OCR offre une vitesse et une précision inégalées, soutenant plus de 140 langues, notamment l’anglais, le cyrillique, l’arabe, le persan, l’hindi, le chinois, le japonais, le coréen, le tamoul et bien d’autres. Qu’il s’agisse d’images numérisées, de photos de smartphones, de captures d’écran ou de PDF numérisées, obtiennent des résultats dans des formats de documents et d’échange de données populaires. Tirez parti des filtres de prétraitement pour gérer les images tournées, biaisées et bruyantes.

OCR efficace et précis
Expérience de vitesse et de précision inégalées dans les résultats de l'OCR avec une technologie avancée Python.
Multilingue
Reconnaître le texte en 140+ langues: anglais, français, allemand, espagnol, russe, chinois, hindi, japonais, coréen, tamoul, arabe, persan, et plus encore.
Universel
Traitez sans effort des images provenant de diverses sources - scanners, caméras et smartphones - en utilisant Python.
Langues asiatiques
Atteignez une reconnaissance précise des scripts chinois, arabe, devanagari et dravidien, ainsi que de textes en langue mixte.
Disservateur
Maintenez le formatage de la source pour une représentation précise du texte et reconnaissez les tables.
Exemple de code en direct
Convertissez une image en texte en seulement trois lignes de code Python. Essayez par vous-même!
* En téléchargeant vos fichiers ou en utilisant le service avec lequel vous êtes d'accord avec notre Conditions d'utilisation et politique de confidentialité.
Convertir l'image en texte
Découvrez plus d'exemples ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Choisissez votre préférence
Choisissez la bonne bibliothèque pour vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.
Versatilité
Python via .NET
Uniformité
Python via Java
Performance
Python via C++
Course partout
Quel que soit le nom, Aspose.ocr pour Python via .NET ne nécessite pas d’installation .NET sur la plate-forme cible. Le package d’installation est déjà livré avec tous les composants requis et peut fonctionner de manière transparente sur n’importe quelle plate-forme - que ce soit une machine locale, un serveur Web ou le cloud.
Formats de fichiers pris en charge
Aspose.OCR for Python via .NET peut fonctionner avec n’importe quel fichier Vous pouvez obtenir à partir d’un scanner ou d’une caméra. Les résultats de reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.
Images
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR par lots
- Multi-page PDF
- DjVu
- ZIP
- Folder
Résultats de la reconnaissance
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation
Aspose.ocr pour Python via .NET est livré en tant que package Python avec des dépendances minimales ou comme un fichier téléchargeable ou paquet PYPI . Facilement installer It dans votre projet, et vous êtes prêt à reconnaître les textes dans 140+ langues et à enregistrer des résultats de reconnaissance dans divers formats.
Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle sans limites.
OCR sous Python
Notre bibliothèque s’intègre facilement, permettant aux applications Python d’exécuter de manière transparente sur n’importe quelle plate-forme - Windows, Windows Server, MacOS, Linux et le cloud.
140+ langues de reconnaissance
Notre bibliothèque Java OCR est une solution universelle pour le traitement des documents, l’extraction des données et la numérisation du contenu à l’échelle mondiale. Avec le soutien à une vaste gamme de scripts d’écriture européens, du Moyen-Orient et d’Asie, il est bien adapté pour tout pays et entreprise.
Aspose OCR pour Java reconnaît le texte dans des documents multilingues, tels que chinois / anglais, arabe / français ou cyrillique / anglais. Les langues suivantes sont prises en charge:
- ** Latin étendu **: anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et 80+ de plus;
- ** Cyrillic ** Alphabet: russe, ukrainien, kazakh, bulgare, y compris les textes cyrilliques / anglais mixtes;
- Arabe, persan, ourdou, y compris des textes mélangés à l’anglais;
- Les langues chinoises, coréennes, japonaises, Devanagari et Dravidiens, y compris l’hindi, le tamoul, le marathi et autres. Les textes en langage mixte sont également pris en charge.
Filtres de traitement puissants
La précision et la fiabilité de la reconnaissance des caractères optiques dépendent fortement de la qualité de l’image d’origine. Aspose OCR pour Python via .NET offre un grand nombre de filtres de traitement d’image entièrement automatisés et manuels qui améliorent une image avant d’être envoyée au moteur OCR:
- Faites pivoter automatiquement les images à l’envers et tournées.
- Détecter les images inversées et extraire le texte blanc sur noir.
- Retirez automatiquement la saleté, les taches, les rayures, les reflets, les gradients indésirables et autres bruit.
- Ajustez automatiquement le contraste d’image.
- Échec automatiquement ou redimensionner manuellement l’image.
- Convertissez les images en noir et blanc ou en niveaux de gris.
- Trouvez des domaines d’image potentiellement problématiques et renvoyez les informations sur le type de défaut et ses coordonnées.
- Augmentez l’épaisseur des caractères dans une image.
- Images bruyantes floues tout en préservant les bords des lettres.
- Sinsionner la courbure de la page et corriger la distorsion de l’objectif de l’appareil photo pour les photos de la page.
Optimisé pour des types de documents spécifiques
Aspose OCR pour Python via .NET offre des réseaux de neurones spécialement formés pour extraire du texte de certains types d’images avec une précision maximale:
Vérificateur orthographique intégré
Bien que notre bibliothèque Python OCR offre une précision de reconnaissance élevée, l’impression de défauts, de saleté ou de polices non standard peut entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer Spell Checker, qui trouve et corrige automatiquement les erreurs d’orthographe en fonction du langage de reconnaissance sélectionné.
Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires d’orthographe communs, vous pouvez fournir vos propres listes de mots.
Reconnaissance par lots
Notre API Python OCR vous libère de reconnaître les images une par une. Utilisez diverses méthodes de traitement par lots pour reconnaître plusieurs images en un seul appel:
- Reconnaissance des fichiers PDF, TIFF et DJVU de plusieurs pages.
- Reconnaissance de tous les fichiers dans un dossier.
- Reconnaissance de tous les fichiers dans une archive.
- Reconnaissance de tous les fichiers à partir d’une liste.
Apprendre par échantillon
OCR pour Python fournit un tableau de Exemples écrit en python, vous permettant de vous familiariser rapidement avec ses fonctions et ses capacités. Gardez des informations pour créer des solutions sur mesure pour répondre aux besoins de votre entreprise Python.
Caractéristiques et capacités
Aspose.OCR for Python via .NET Aspose.ocr pour Python via .NET résout vos tâches rapidement et faciles.
Photo OCR
Extraire le texte des photos du smartphone avec précision au niveau scan.
PDF consultable
Convertissez toute analyse en un document entièrement consultable, indexable et modifiable.
Reconnaissance de l’URL
Reconnaissez une image de l’URL sans la télécharger localement.
Reconnaissance en vrac
Lisez toutes les images de documents, dossiers et archives de plusieurs pages.
Toute police et style
Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.
Reconnaissance de tonnelle
Ajustez chaque paramètre OCR pour les meilleurs résultats de reconnaissance.
Vérificateur orthographique
Améliorer les résultats en corrigeant automatiquement les mots mal orthographiés.
Trouver du texte dans les images
Recherchez du texte ou de l’expression régulière dans un ensemble d’images.
Comparez les textes de l’image
Comparez les textes sur deux images, quel que soit le cas et la mise en page.
Échantillons de code python
Donnez des échantillons de code pour intégrer de manière transparente OCR dans vos applications Python.
Installation
Distribué sous forme de roue Python ou de package téléchargeable autonome, Aspose.ocr pour Python via .NET est facilement distribué. L’intégration dans votre projet Python, directement à partir de votre environnement de développement intégré Python (IDE) préféré, est un processus transparent. Installez-le simplement, et vous êtes prêt à tirer parti de la plage complète des capacités OCR, la reconnaissance de l’économie d’économie entraîne divers formats.
post-installation, vous pouvez rapidement commencer à utiliser Aspose.ocr pour Python via .NET, mais avec certaines limitations. Une licence temporaire soulève toutes les restrictions de version d’essai pendant 30 jours. Utilisez cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée sur l’achat d’Aspose.ocr pour Python via .NET à un stade ultérieur.
Licence de chargement
lic = License()
lic.set_license(self.licPath)
Reconnaître le texte sur les photos
La lecture du texte de tout contenu dans Aspose OCR pour Python est aussi simple que d’appeler une méthode de reconnaissance universelle.
Convertir la photo en texte - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Convertisseur universel Python
Notre API lit avec toute l’image des scanners, des caméras ou des smartphones: documents PDF, JPEG, PNG, TIFF, GIF, images BMP et même fichiers DJVU. La prise en charge complète des documents PDF de plusieurs pages, les images TIFF et DJVU assure la polyvalence. Vous pouvez également fournir une image du Web via une URL.
Les résultats de reconnaissance sont renvoyés dans des formats de documents et d’échange de données populaires: texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.
Reconnaître le PDF et enregistrer les résultats vers divers formats de sortie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimisation des ressources dans Python
La reconnaissance optique des caractères exige des ressources. Notre API offre des moyens flexibles d’équilibrer la triade classique de qualité-prix:
- Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
- Spécifiez le nombre de threads alloués pour la reconnaissance ou permettez à la bibliothèque de s'étendre automatiquement au nombre de cœurs de processeur.
- Libérez le CPU en déchargeant les calculs sur le backend .NET.
Reconnaissance rapide - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Reconnaître une seule ligne
Si votre image est déjà coupée en une seule ligne de texte, elle peut être reconnue dans le mode le plus rapide possible, sans corrections automatisées, détection de structure de contenu et autres étapes consommatrices de ressources. Il peut accélérer l’OCR jusqu’à 7 fois plus rapide que le processus de reconnaissance normal.
Reconnaître une ligne de texte unique sur l'image - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)