Pourquoi Aspose.OCR pour Python via .NET ?

Embarquez pour un voyage avec Aspose OCR pour Python via .NET – une API OCR polyvalente et conviviale. Intégrez la fonctionnalité OCR dans vos applications Python avec moins de 5 lignes de code, éliminant ainsi le besoin de réseaux mathématiques ou neuronaux complexes. Notre puissant moteur OCR offre une vitesse et une précision inégalées, prenant en charge plus de 130 langues, dont l’anglais, le cyrillique, l’arabe, le persan, l’hindi, le chinois, le japonais, le coréen, le tamoul et bien d’autres. Qu’il s’agisse d’images numérisées, de photos de smartphone, de captures d’écran ou de PDF numérisés, obtenez des résultats dans des formats d’échange de documents et de données courants. Tirez parti des filtres de prétraitement pour gérer les images pivotées, asymétriques et bruitées.

Illustration ocr

OCR efficace et précis

Bénéficiez d'une vitesse et d'une précision inégalées dans les résultats OCR grâce à la technologie Python avancée.

Multilingue

Reconnaissez du texte dans plus de 140 langues : anglais, français, allemand, espagnol, russe, chinois, hindi, japonais, coréen, tamoul, arabe, persan, etc.

Universel

Traitez sans effort des images provenant de diverses sources (scanners, appareils photo et smartphones) à l'aide de Python.

langues asiatiques

Obtenez une reconnaissance précise des écritures chinoises, arabes, dévanagari et dravidiennes, ainsi que des textes en langues mixtes.

Conserver la mise en page

Conservez le formatage source pour une représentation précise du texte et reconnaissez les tableaux.

Exemple de code en direct

Convertissez une image en texte en seulement TROIS lignes de code Python. Essayez par vous-même !

Prêt à reconnaître Prêt à reconnaître Déposez un fichier ici ou cliquez pour parcourir *

* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez notre Conditions d'utilisation et politique de confidentialité.

Résultat de la reconnaissance
 

Convertir l'image en texte

Découvrez plus d'exemples >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Choisissez votre préférence

Choisissez la bibliothèque adaptée à vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.

Versatilité

Python via .NET

Développement facile, lisibilité et maintenabilité du code
Possède le plus de fonctionnalités et reçoit les mises à jour les plus fréquentes
La vitesse globale peut être un peu plus lente que celle des autres plateformes

Uniformité

Python via Java

Utilisez la même bibliothèque sur n’importe quelle plateforme
Exécutez votre application en toute transparence sur n’importe quel appareil
Nécessite Java Runtime Environment (JRE) version 8 ou ultérieure

Performance

Python via C++

La vitesse la plus rapide possible quelle que soit la plateforme
Un grand contrôle sur la gestion des ressources
Destiné aux développeurs expérimentés

Fonctionne partout

Quel que soit son nom, Aspose.OCR pour Python via .NET ne nécessite pas l’installation de .NET sur la plateforme cible. Le package d’installation est déjà livré avec tous les composants requis et peut fonctionner de manière transparente sur n’importe quelle plate-forme, qu’il s’agisse d’une machine locale, d’un serveur Web ou du cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formats de fichiers pris en charge

Aspose.OCR for Python via .NET peut fonctionner avec n’importe quel fichier vous pouvez l’obtenir à partir d’un scanner ou d’un appareil photo. Les résultats de la reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.

Images

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

ROC par lots

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Résultats de reconnaissance

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installation

Aspose.OCR pour Python via .NET est fourni sous forme de package Python avec des dépendances minimales ou sous forme de fichier téléchargeable ou de [package PyPI](https : //pypi.org/project/aspose-ocr-python-net/). Installez-le facilement dans votre projet et vous êtes prêt à reconnaître des textes dans plus de 140 langues et à enregistrer les résultats de la reconnaissance dans différents formats.

Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle et sans limitations.

OCR sous Python

Notre bibliothèque s’intègre facilement, permettant aux applications Python de s’exécuter de manière transparente sur n’importe quelle plateforme : ordinateur de bureau Windows, Windows Server, macOS, Linux et cloud.

Plus de 140 langues de reconnaissance

Notre bibliothèque Java OCR est une solution universelle pour le traitement de documents, l’extraction de données et la numérisation de contenu à l’échelle mondiale. Prenant en charge une vaste gamme de scripts d’écriture européens, du Moyen-Orient et d’Asie, il est bien adapté à tous les pays et à toutes les entreprises.

Aspose OCR pour Java reconnaît le texte dans les documents multilingues, tels que chinois/anglais, arabe/français ou cyrillique/anglais. Les langues suivantes sont prises en charge :

  • Latin étendu : anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et plus de 80 autres ;
  • Alphabet cyrillique : russe, ukrainien, kazakh, bulgare, y compris des textes mixtes cyrillique/anglais ;
  • arabe, persan, ourdou, y compris des textes mélangés à de l’anglais ;
  • Langues chinoise, coréenne, japonaise, devanagari et dravidienne, dont l’hindi, le tamoul, le marathi et d’autres. Les textes en langues mixtes sont également pris en charge.

Filtres de traitement puissants

La précision et la fiabilité de la reconnaissance optique des caractères dépendent fortement de la qualité de l’image originale. Aspose OCR for Python via .NET propose un grand nombre de filtres de traitement d’image entièrement automatisés et manuels qui améliorent une image avant qu’elle ne soit envoyée au moteur OCR :

  • Faites pivoter automatiquement les images inversées et pivotées.
  • Détectez les images inversées et extrayez le texte blanc sur noir.
  • Supprimez automatiquement la saleté, les taches, les rayures, les reflets, les dégradés indésirables et autres bruits.
  • Ajustez automatiquement le contraste de l’image.
  • Mise à l’échelle automatique ou redimensionnement manuel de l’image.
  • Convertissez les images en noir et blanc ou en niveaux de gris.
  • Trouver les zones d’image potentiellement problématiques et renvoyer les informations sur le type de défaut et ses coordonnées.
  • Augmentez l’épaisseur des caractères dans une image.
  • Floutez les images bruyantes tout en préservant les bords des lettres.
  • Redressez la courbure de la page et corrigez la distorsion de l’objectif de l’appareil photo pour les photos de la page.

Optimisé pour des types de documents spécifiques

Aspose OCR pour Python via .NET propose des réseaux de neurones spécialement entraînés pour extraire le texte de certains types d’images avec une précision maximale :

Correcteur orthographique intégré

Bien que notre bibliothèque Python OCR offre une précision de reconnaissance élevée, des défauts d’impression, de la saleté ou des polices non standard peuvent entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer le correcteur orthographique, qui recherche et corrige automatiquement les fautes d’orthographe en fonction de la langue de reconnaissance sélectionnée.

Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires orthographiques courants, vous pouvez fournir vos propres listes de mots.

Reconnaissance par lots

Notre API Python OCR vous libère de la reconnaissance des images une par une. Utilisez diverses méthodes de traitement par lots pour reconnaître plusieurs images en un seul appel :

  • Reconnaissance des fichiers PDF, TIFF et DjVu multipages.
  • Reconnaissance de tous les fichiers d’un dossier.
  • Reconnaissance de tous les fichiers d’une archive.
  • Reconnaissance de tous les fichiers d’une liste.

Apprentissage par échantillon

OCR pour Python fournit un tableau d’ exemples écrits en Python, vous permettant de vous familiariser rapidement avec ses fonctions et capacités. Obtenez des informations pour créer des solutions sur mesure pour répondre aux besoins de votre entreprise Python.

Caractéristiques et capacités

Aspose.OCR for Python via .NET résout vos tâches rapidement et facilement.

Feature icon

ROC de photos

Extrayez le texte des photos de votre smartphone avec une précision de niveau numérisation.

Feature icon

PDF consultable

Convertissez n’importe quelle numérisation en un document entièrement consultable, indexable et modifiable.

Feature icon

Reconnaissance d’URL

Reconnaissez une image à partir d’une URL sans la télécharger localement.

Feature icon

Reconnaissance groupée

Lisez toutes les images de documents, dossiers et archives de plusieurs pages.

Feature icon

N’importe quelle police et style

Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.

Feature icon

Affiner la reconnaissance

Ajustez chaque paramètre OCR pour obtenir les meilleurs résultats de reconnaissance.

Feature icon

Correcteur orthographique

Améliorez les résultats en corrigeant automatiquement les mots mal orthographiés.

Feature icon

Rechercher du texte dans les images

Recherchez du texte ou une expression régulière dans un ensemble d’images.

Feature icon

Comparer les textes des images

Comparez les textes sur deux images, quels que soient la casse et la mise en page.

Exemples de code Python

Plongez dans des exemples de code pour intégrer de manière transparente l’OCR dans vos applications Python.

Installation

Distribué sous forme de roue Python ou de package téléchargeable autonome, Aspose.OCR pour Python via .NET est facilement distribué. L’intégration dans votre projet Python, directement à partir de votre environnement de développement intégré (IDE) Python préféré, est un processus transparent. Installez-le simplement et vous êtes prêt à exploiter la gamme complète des fonctionnalités OCR, en enregistrant les résultats de reconnaissance dans différents formats.

Après l’installation, vous pouvez rapidement commencer à utiliser Aspose.OCR pour Python via .NET. , mais avec certaines limites. Une licence temporaire lève toutes les restrictions de la version d’essai pendant 30 jours. Profitez de cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée concernant l’achat d’Aspose.OCR pour Python via .NET à un stade ultérieur.

Charger la licence

lic = License()
lic.set_license(self.licPath)

Reconnaître le texte sur les photos

Lire du texte à partir de n’importe quel contenu dans Aspose OCR pour Python est aussi simple que d’appeler une méthode de reconnaissance universelle.

Convertir une photo en texte - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Convertisseur universel Python

Notre API lit habilement n’importe quelle image provenant de scanners, d’appareils photo ou de smartphones : documents PDF, JPEG, PNG, TIFF, GIF, images BMP et même fichiers DjVu. La prise en charge complète des documents PDF de plusieurs pages, des images TIFF et DjVu garantit la polyvalence. Vous pouvez également fournir une image du Web via une URL.

Les résultats de la reconnaissance sont renvoyés dans des formats d’échange de documents et de données courants : texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.

Reconnaître le PDF et enregistrer les résultats dans différents formats de sortie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimisation des ressources en Python

La reconnaissance optique de caractères nécessite des ressources. Notre API offre des moyens flexibles d’équilibrer la triade classique temps-prix-qualité :

  • Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
  • Spécifiez le nombre de threads alloués pour la reconnaissance ou autorisez la bibliothèque à s'adapter automatiquement au nombre de cœurs de processeur.
  • Libérez le processeur en déchargeant les calculs vers le backend .NET.

Reconnaissance rapide - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconnaître une seule ligne

Si votre image est déjà découpée en une seule ligne de texte, elle peut être reconnue le plus rapidement possible, sans corrections automatisées, détection de la structure du contenu et autres étapes gourmandes en ressources. Il peut accélérer l’OCR jusqu’à 7 fois plus vite que le processus de reconnaissance normal.

Reconnaître une seule ligne de texte sur une image - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)