OCR for Java

OCR for C++

OCR for Python via Java

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via .NET

Bibliothèque Python OCR

Extraire des textes d’images de votre application Python à l’aide de la bibliothèque Python OCR. Transformez les images en texte sans effort avec le code API Python concis, déverrouillant les capacités avancées OCR.

Télécharger Procès Achat

Voyez ce qui est nouveau

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-net

Pourquoi aspose.ocr pour Python via .net?

Embarquez dans un voyage avec Aspose OCR pour Python via .NET - une API OCR polyvalente et conviviale. Intégrez la fonctionnalité OCR dans vos applications Python avec moins de 5 lignes de code, éliminant le besoin de mathématiques ou de réseaux de neurones complexes. Notre puissant moteur OCR offre une vitesse et une précision inégalées, soutenant plus de 140 langues, notamment l’anglais, le cyrillique, l’arabe, le persan, l’hindi, le chinois, le japonais, le coréen, le tamoul et bien d’autres. Qu’il s’agisse d’images numérisées, de photos de smartphones, de captures d’écran ou de PDF numérisées, obtiennent des résultats dans des formats de documents et d’échange de données populaires. Tirez parti des filtres de prétraitement pour gérer les images tournées, biaisées et bruyantes.

OCR efficace et précis

Expérience de vitesse et de précision inégalées dans les résultats de l'OCR avec une technologie avancée Python.

Multilingue

Reconnaître le texte en 140+ langues: anglais, français, allemand, espagnol, russe, chinois, hindi, japonais, coréen, tamoul, arabe, persan, et plus encore.

Universel

Traitez sans effort des images provenant de diverses sources - scanners, caméras et smartphones - en utilisant Python.

Langues asiatiques

Atteignez une reconnaissance précise des scripts chinois, arabe, devanagari et dravidien, ainsi que de textes en langue mixte.

Disservateur

Maintenez le formatage de la source pour une représentation précise du texte et reconnaissez les tables.

Exemple de code en direct

Convertissez une image en texte en seulement trois lignes de code Python. Essayez par vous-même!

Prêt à reconnaître Prêt à reconnaître Déposez un fichier ici ou cliquez pour parcourir *

* En téléchargeant vos fichiers ou en utilisant le service avec lequel vous êtes d'accord avec notre Conditions d'utilisation et politique de confidentialité.

Résultat de reconnaissance

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Choisissez votre préférence

Choisissez la bonne bibliothèque pour vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.

Python via .NET

Développement, lisibilité et maintenabilité faciles du code

Possède le plus de fonctionnalités et reçoit les mises à jour les plus fréquentes

La vitesse globale peut être un peu plus lente que les autres plates-formes

Python via Java

Utilisez la même bibliothèque sur n’importe quelle plate-forme

Exécutez de manière transparente votre application sur n’importe quel appareil

Nécessite le Java Runtime Environment (JRE) version 8 ou version ultérieure

Python via C++

La vitesse la plus rapide possible quelle que soit la plate-forme

Beaucoup de contrôle sur la gestion des ressources

Ciblé vers les développeurs expérimentés

Course partout

Quel que soit le nom, Aspose.ocr pour Python via .NET ne nécessite pas d’installation .NET sur la plate-forme cible. Le package d’installation est déjà livré avec tous les composants requis et peut fonctionner de manière transparente sur n’importe quelle plate-forme - que ce soit une machine locale, un serveur Web ou le cloud.

Formats de fichiers pris en charge

Aspose.OCR for Python via .NET peut fonctionner avec n’importe quel fichier Vous pouvez obtenir à partir d’un scanner ou d’une caméra. Les résultats de reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.

Images

JPEG
PNG
TIFF
BMP
GIF

OCR par lots

Multi-page PDF
DjVu
ZIP
Folder

Résultats de la reconnaissance

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

Installation

Aspose.ocr pour Python via .NET est livré en tant que package Python avec des dépendances minimales ou comme un fichier téléchargeable ou paquet PYPI . Facilement installer It dans votre projet, et vous êtes prêt à reconnaître les textes dans 140+ langues et à enregistrer des résultats de reconnaissance dans divers formats.

Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle sans limites.

OCR sous Python

Notre bibliothèque s’intègre facilement, permettant aux applications Python d’exécuter de manière transparente sur n’importe quelle plate-forme - Windows, Windows Server, MacOS, Linux et le cloud.

140+ langues de reconnaissance

Notre bibliothèque Java OCR est une solution universelle pour le traitement des documents, l’extraction des données et la numérisation du contenu à l’échelle mondiale. Avec le soutien à une vaste gamme de scripts d’écriture européens, du Moyen-Orient et d’Asie, il est bien adapté pour tout pays et entreprise.

Aspose OCR pour Java reconnaît le texte dans des documents multilingues, tels que chinois / anglais, arabe / français ou cyrillique / anglais. Les langues suivantes sont prises en charge:

** Latin étendu **: anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et 80+ de plus;
** Cyrillic ** Alphabet: russe, ukrainien, kazakh, bulgare, y compris les textes cyrilliques / anglais mixtes;
Arabe, persan, ourdou, y compris des textes mélangés à l’anglais;
Les langues chinoises, coréennes, japonaises, Devanagari et Dravidiens, y compris l’hindi, le tamoul, le marathi et autres. Les textes en langage mixte sont également pris en charge.

Filtres de traitement puissants

La précision et la fiabilité de la reconnaissance des caractères optiques dépendent fortement de la qualité de l’image d’origine. Aspose OCR pour Python via .NET offre un grand nombre de filtres de traitement d’image entièrement automatisés et manuels qui améliorent une image avant d’être envoyée au moteur OCR:

Faites pivoter automatiquement les images à l’envers et tournées.
Détecter les images inversées et extraire le texte blanc sur noir.
Retirez automatiquement la saleté, les taches, les rayures, les reflets, les gradients indésirables et autres bruit.
Ajustez automatiquement le contraste d’image.
Échec automatiquement ou redimensionner manuellement l’image.
Convertissez les images en noir et blanc ou en niveaux de gris.
Trouvez des domaines d’image potentiellement problématiques et renvoyez les informations sur le type de défaut et ses coordonnées.
Augmentez l’épaisseur des caractères dans une image.
Images bruyantes floues tout en préservant les bords des lettres.
Sinsionner la courbure de la page et corriger la distorsion de l’objectif de l’appareil photo pour les photos de la page.

Optimisé pour des types de documents spécifiques

Aspose OCR pour Python via .NET offre des réseaux de neurones spécialement formés pour extraire du texte de certains types d’images avec une précision maximale:

Vérificateur orthographique intégré

Bien que notre bibliothèque Python OCR offre une précision de reconnaissance élevée, l’impression de défauts, de saleté ou de polices non standard peut entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer Spell Checker, qui trouve et corrige automatiquement les erreurs d’orthographe en fonction du langage de reconnaissance sélectionné.

Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires d’orthographe communs, vous pouvez fournir vos propres listes de mots.

Reconnaissance par lots

Notre API Python OCR vous libère de reconnaître les images une par une. Utilisez diverses méthodes de traitement par lots pour reconnaître plusieurs images en un seul appel:

Reconnaissance des fichiers PDF, TIFF et DJVU de plusieurs pages.
Reconnaissance de tous les fichiers dans un dossier.
Reconnaissance de tous les fichiers dans une archive.
Reconnaissance de tous les fichiers à partir d’une liste.

Apprendre par échantillon

OCR pour Python fournit un tableau de Exemples écrit en python, vous permettant de vous familiariser rapidement avec ses fonctions et ses capacités. Gardez des informations pour créer des solutions sur mesure pour répondre aux besoins de votre entreprise Python.

Caractéristiques et capacités

Aspose.OCR for Python via .NET Aspose.ocr pour Python via .NET résout vos tâches rapidement et faciles.

Photo OCR

Extraire le texte des photos du smartphone avec précision au niveau scan.

PDF consultable

Convertissez toute analyse en un document entièrement consultable, indexable et modifiable.

Reconnaissance de l’URL

Reconnaissez une image de l’URL sans la télécharger localement.

Reconnaissance en vrac

Lisez toutes les images de documents, dossiers et archives de plusieurs pages.

Toute police et style

Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.

Reconnaissance de tonnelle

Ajustez chaque paramètre OCR pour les meilleurs résultats de reconnaissance.

Vérificateur orthographique

Améliorer les résultats en corrigeant automatiquement les mots mal orthographiés.

Trouver du texte dans les images

Recherchez du texte ou de l’expression régulière dans un ensemble d’images.

Comparez les textes de l’image

Comparez les textes sur deux images, quel que soit le cas et la mise en page.

Échantillons de code python

Donnez des échantillons de code pour intégrer de manière transparente OCR dans vos applications Python.

Installation

Distribué sous forme de roue Python ou de package téléchargeable autonome, Aspose.ocr pour Python via .NET est facilement distribué. L’intégration dans votre projet Python, directement à partir de votre environnement de développement intégré Python (IDE) préféré, est un processus transparent. Installez-le simplement, et vous êtes prêt à tirer parti de la plage complète des capacités OCR, la reconnaissance de l’économie d’économie entraîne divers formats.
post-installation, vous pouvez rapidement commencer à utiliser Aspose.ocr pour Python via .NET, mais avec certaines limitations. Une licence temporaire soulève toutes les restrictions de version d’essai pendant 30 jours. Utilisez cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée sur l’achat d’Aspose.ocr pour Python via .NET à un stade ultérieur.

Licence de chargement

lic = License()
lic.set_license(self.licPath)

Reconnaître le texte sur les photos

La lecture du texte de tout contenu dans Aspose OCR pour Python est aussi simple que d’appeler une méthode de reconnaissance universelle.

Convertir la photo en texte - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Convertisseur universel Python

Notre API lit avec toute l’image des scanners, des caméras ou des smartphones: documents PDF, JPEG, PNG, TIFF, GIF, images BMP et même fichiers DJVU. La prise en charge complète des documents PDF de plusieurs pages, les images TIFF et DJVU assure la polyvalence. Vous pouvez également fournir une image du Web via une URL.

Les résultats de reconnaissance sont renvoyés dans des formats de documents et d’échange de données populaires: texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.

Reconnaître le PDF et enregistrer les résultats vers divers formats de sortie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimisation des ressources dans Python

La reconnaissance optique des caractères exige des ressources. Notre API offre des moyens flexibles d’équilibrer la triade classique de qualité-prix:

Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
Spécifiez le nombre de threads alloués pour la reconnaissance ou permettez à la bibliothèque de s'étendre automatiquement au nombre de cœurs de processeur.
Libérez le CPU en déchargeant les calculs sur le backend .NET.

Reconnaissance rapide - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconnaître une seule ligne

Si votre image est déjà coupée en une seule ligne de texte, elle peut être reconnue dans le mode le plus rapide possible, sans corrections automatisées, détection de structure de contenu et autres étapes consommatrices de ressources. Il peut accélérer l’OCR jusqu’à 7 fois plus rapide que le processus de reconnaissance normal.

Reconnaître une ligne de texte unique sur l'image - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)

Bibliothèque Python OCR

Convertir des images en texte avec Python OCR

Pourquoi aspose.ocr pour Python via .net?

OCR efficace et précis

Multilingue

Universel

Langues asiatiques

Disservateur

Exemple de code en direct

Convertir l'image en texte

Choisissez votre préférence

Versatilité

Uniformité

Performance

Course partout

Formats de fichiers pris en charge

Images

OCR par lots

Résultats de la reconnaissance

Installation

OCR sous Python

140+ langues de reconnaissance

Filtres de traitement puissants

Optimisé pour des types de documents spécifiques

Vérificateur orthographique intégré

Reconnaissance par lots

Apprendre par échantillon

Caractéristiques et capacités

Échantillons de code python

Installation

Licence de chargement

Reconnaître le texte sur les photos

Convertir la photo en texte - Python

Convertisseur universel Python

Reconnaître le PDF et enregistrer les résultats vers divers formats de sortie - Python

Optimisation des ressources dans Python

Reconnaissance rapide - Python

Reconnaître une seule ligne

Reconnaître une ligne de texte unique sur l'image - Python

Prêt, réglez, allez!

Soutien et apprentissage

Explorez l’API

Obtenir un soutien

Sorties