Pourquoi opter pour Aspose.OCR pour Python via .NET ?

Embarquez pour un voyage avec Aspose.OCR pour Python via .NET – une API OCR polyvalente et conviviale. Intégrez la fonctionnalité OCR dans vos applications Python avec moins de 5 lignes de code, éliminant ainsi le besoin de réseaux mathématiques ou neuronaux complexes. Notre puissant moteur OCR offre une vitesse et une précision inégalées, prenant en charge 28 langues, dont les scripts latins, cyrilliques et chinois. Qu’il s’agisse d’images numérisées, de photos de smartphone, de captures d’écran ou de PDF numérisés, obtenez des résultats dans des formats d’échange de documents et de données courants. Tirez parti des filtres de prétraitement pour gérer les images pivotées, asymétriques et bruitées. Optimisez les performances de reconnaissance et la charge du système en déchargeant les tâches gourmandes en ressources vers le backend .NET.

Illustration ocr

Maîtrise OCR efficace et précise

Bénéficiez d'une vitesse et d'une précision inégalées dans les résultats OCR grâce à la technologie avancée Python et .NET.

Excellence multilingue

Reconnaissez du texte dans 28 langues, couvrant les écritures latines, cyrilliques et chinoises avec facilité et précision.

Traitement d'image adaptable

Traitez sans effort des images provenant de diverses sources (scanners, appareils photo et smartphones) à l'aide de Python et .NET.

Maîtrise des caractères chinois

Obtenez une reconnaissance précise de plus de 6 000 caractères chinois, garantissant l’exactitude avec Python et .NET.

Préservation des styles et formats de police

Conservez les styles de police et le formatage pour une représentation précise du texte, améliorant ainsi la polyvalence avec Python et .NET.

Exemple de code en direct

Découvrez la simplicité : convertissez une image en texte en seulement trois lignes de code Python !

Prêt à reconnaître Prêt à reconnaître Déposez un fichier ici ou cliquez pour parcourir *

* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez notre Conditions d'utilisation et politique de confidentialité.

Résultat de la reconnaissance
 

Convertir l'image en texte

Découvrez plus d'exemples >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

L’autonomisation .NET pour Python dans tous les coins

Aspose.OCR pour Python via .NET fonctionne de manière transparente sur n’importe quelle plate-forme prenant en charge .NET Framework 4.0 et versions ultérieures – qu’il s’agisse d’une machine locale, d’un site Web serveur ou le cloud.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formats de fichiers pris en charge

Aspose.OCR for Python via .NET peut fonctionner avec pratiquement n’importe quel fichier vous pouvez l’obtenir à partir d’un scanner ou d’un appareil photo. Les résultats de la reconnaissance sont renvoyés dans les formats d’échange de fichiers et de données les plus courants qui peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.

Images

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

ROC par lots

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Résultats de reconnaissance

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installation pour Python avec backend .NET

Aspose.OCR pour Python via .NET est fourni sous forme de package Python avec des dépendances minimales ou sous forme de fichier téléchargeable . Installez-le facilement dans votre projet et vous êtes prêt à reconnaître des textes dans plusieurs langues prises en charge et à enregistrer les résultats de la reconnaissance dans différents formats.

Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle et sans limitations.

OCR puissant pour les applications Python

Notre bibliothèque s’intègre facilement, permettant aux applications Python de s’exécuter de manière transparente sur n’importe quelle plateforme : ordinateur de bureau Windows, Windows Server, macOS, Linux et cloud.

28 langues de reconnaissance

Notre API Python et .NET OCR reconnaît une multitude de langages et de scripts d’écriture populaires, y compris des langages mixtes :

Laissez la détection de langue à la bibliothèque ou définissez la langue vous-même pour des performances et une fiabilité de reconnaissance améliorées.

  • Alphabet latin étendu : croate, tchèque, danois, néerlandais, anglais, estonien, finnois, français, allemand, italien, letton, lituanien, norvégien, polonais, portugais, roumain, slovaque, slovène, espagnol, suédois ;
  • Alphabet cyrillique : biélorusse, bulgare, kazakh, russe, serbe, ukrainien ;
  • Chinois : plus de 6 000 caractères ;
  • Hindi.

Filtres de traitement puissants

La précision et la fiabilité de la reconnaissance optique des caractères dépendent fortement de la qualité de l’image originale. Aspose.OCR pour Python via .NET propose un grand nombre de filtres de traitement d’image entièrement automatisés et manuels qui améliorent une image avant qu’elle ne soit envoyée au moteur OCR :

  • Redressez automatiquement les images alignées selon un léger angle par rapport à l’horizontale.
  • Faites pivoter manuellement les images fortement asymétriques.
  • Supprimez automatiquement la saleté, les taches, les rayures, les reflets, les dégradés indésirables et autres bruits.
  • Ajustez automatiquement le contraste de l’image.
  • Mise à l’échelle automatique ou redimensionnement manuel de l’image.
  • Convertissez les images en noir et blanc ou en niveaux de gris.
  • Inversez les couleurs de l’image afin que les zones claires apparaissent sombres et les zones sombres apparaissent claires.
  • Augmentez l’épaisseur des caractères dans une image.
  • Floutez les images bruyantes tout en préservant les bords des lettres.
  • Redressez la courbure de la page et corrigez la distorsion de l’objectif de l’appareil photo pour les photos de la page.

Optimisé pour des types de documents spécifiques

Aspose.OCR pour Python via .NET propose des réseaux de neurones spécialement entraînés pour extraire le texte de certains types d’images avec une précision maximale :

Correcteur orthographique intégré

Bien qu’Aspose.OCR pour Python via .NET offre une précision de reconnaissance élevée, des défauts d’impression, de la saleté ou des polices non standard peuvent entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer le correcteur orthographique, qui recherche et corrige automatiquement les fautes d’orthographe en fonction de la langue de reconnaissance sélectionnée.

Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires orthographiques courants, vous pouvez fournir vos propres listes de mots.

Reconnaissance par lots simplifiée

Notre API Python OCR vous libère de la reconnaissance des images une par une. Utilisez diverses méthodes de traitement par lots pour reconnaître plusieurs images en un seul appel :

  • Reconnaissance des fichiers PDF, TIFF et DjVu multipages.
  • Reconnaissance de tous les fichiers d’un dossier.
  • Reconnaissance de tous les fichiers d’une archive.
  • Reconnaissance de tous les fichiers d’une liste.

Apprendre grâce à des exemples Python

Aspose.OCR pour Python via .NET fournit un tableau d’ exemples écrits en Python, vous permettant de vous familiariser rapidement avec ses fonctions et capacités. Obtenez des informations pour créer des solutions sur mesure pour répondre aux besoins de votre entreprise Python.

Caractéristiques et capacités

Aspose.OCR for Python via .NET Explorez les capacités avancées d’Aspose.OCR pour C++.

Feature icon

ROC de photos

Extrayez le texte des photos de votre smartphone avec une précision de niveau numérisation.

Feature icon

PDF consultable

Convertissez n’importe quelle numérisation en un document entièrement consultable et indexable.

Feature icon

Reconnaissance d’URL

Reconnaissez une image à partir d’une URL sans la télécharger localement.

Feature icon

Reconnaissance groupée

Lisez toutes les images de documents, dossiers et archives de plusieurs pages.

Feature icon

N’importe quelle police et style

Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.

Feature icon

Affiner la reconnaissance

Ajustez chaque paramètre OCR pour obtenir les meilleurs résultats de reconnaissance.

Feature icon

Correcteur orthographique

Améliorez les résultats en corrigeant automatiquement les mots mal orthographiés.

Feature icon

Rechercher du texte dans les images

Recherchez du texte ou une expression régulière dans un ensemble d’images.

Feature icon

Comparer les textes des images

Comparez les textes sur deux images, quels que soient la casse et la mise en page.

Exemples de code Python

Plongez dans des exemples de code pour intégrer de manière transparente Aspose.OCR pour Python via .NET dans vos applications Python.

Maîtrise de l’installation en Python

Distribué sous forme de roue Python ou de package téléchargeable autonome, Aspose.OCR pour Python via .NET est facilement distribué. L’intégration dans votre projet Python, directement à partir de votre environnement de développement intégré (IDE) Python préféré, est un processus transparent. Installez-le simplement et vous êtes prêt à exploiter la gamme complète des fonctionnalités OCR, en enregistrant les résultats de reconnaissance dans différents formats.

Après l’installation, vous pouvez rapidement commencer à utiliser Aspose.OCR pour Python via .NET. , mais avec certaines limites. Une licence temporaire lève toutes les restrictions de la version d’essai pendant 30 jours. Profitez de cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée concernant l’achat d’Aspose.OCR pour Python via .NET à un stade ultérieur.

Charger la licence

lic = License()
lic.set_license(self.licPath)

Reconnaître le texte sur les photos

Lire du texte à partir de n’importe quel contenu dans Aspose.OCR pour Python via .NET est aussi simple que d’appeler une méthode universelle reconnu ().

Convertir une photo en texte - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Convertisseur universel Python

Notre API lit habilement n’importe quelle image provenant de scanners, d’appareils photo ou de smartphones : documents PDF, JPEG, PNG, TIFF, GIF, images BMP et même fichiers DjVu. La prise en charge complète des documents PDF de plusieurs pages, des images TIFF et DjVu garantit la polyvalence. Vous pouvez également fournir une image du Web via une URL.

Les résultats de la reconnaissance sont renvoyés dans des formats d’échange de documents et de données courants : texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.

Reconnaître le PDF et enregistrer les résultats dans différents formats de sortie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimisation des ressources en Python

La reconnaissance optique de caractères nécessite des ressources. Notre API offre des moyens flexibles d’équilibrer la triade classique temps-prix-qualité :

  • Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
  • Spécifiez le nombre de threads alloués pour la reconnaissance ou autorisez la bibliothèque à s'adapter automatiquement au nombre de cœurs de processeur.
  • Libérez le processeur en déchargeant les calculs vers le backend .NET.

Reconnaissance rapide - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconnaître une seule ligne

Si votre image est déjà découpée en une seule ligne de texte, elle peut être reconnue le plus rapidement possible, sans corrections automatisées, détection de la structure du contenu et autres étapes gourmandes en ressources. Il peut accélérer l’OCR jusqu’à 7 fois plus vite que le processus de reconnaissance normal.

Reconnaître une seule ligne de texte sur une image - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)