Pourquoi Aspose.OCR pour Python via Java ?

Aspose.OCR pour Python via Java intègre de manière transparente de puissantes fonctionnalités de reconnaissance optique de caractères (OCR) dans vos blocs-notes et applications Python multiplateformes. Grâce à notre API intuitive et rapide, vous pouvez facilement extraire du texte à partir de numérisations, de captures d’écran, de liens Web ou de photos de smartphone, fournissant ainsi des résultats prêts à être consolidés, analysés ou stockés. Reconnaissez les images numérisées, les photos de smartphone, les captures d’écran et les PDF numérisés, en enregistrant les résultats dans des formats de documents courants. Les filtres de prétraitement avancés gèrent les images pivotées, asymétriques et bruitées. Optimisez les performances en déchargeant les tâches sur le GPU.

Illustration ocr

OCR rapide et précis

Obtenez des résultats OCR rapides et précis grâce à notre technologie avancée Python via Java.

Prise en charge multilingue

Reconnaissez le texte dans 28 langues, y compris les scripts latins, cyrilliques et chinois, garantissant ainsi la polyvalence de vos applications Python via Java.

Prise en charge flexible des images

Traitez les images des scanners, des appareils photo et des smartphones de manière transparente avec Python via Java.

Précision dans la reconnaissance des caractères chinois

Reconnaissez plus de 6 000 caractères chinois avec précision dans vos projets Python via Java.

Conserver les styles de police et le formatage

Conservez les styles de police et le formatage pour une représentation précise du texte reconnu dans vos applications Python via Java.

Exemple de code en direct

Initiez la reconnaissance de texte à partir d’images en seulement trois lignes de code. Découvrez la simplicité !

Prêt à reconnaître Prêt à reconnaître Déposez un fichier ici ou cliquez pour parcourir *

* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez notre Conditions d'utilisation et politique de confidentialité.

Résultat de la reconnaissance
 

Convertir l'image en texte

Plus d'exemples >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Compatibilité du back-end Java

Conçue comme un module Python, notre bibliothèque garantit la compatibilité avec les principaux systèmes d’exploitation prenant en charge Java - y compris Microsoft Windows, Linux et macOS, ou le plateformes cloud. Cela vous permet de développer des applications sur une plate-forme et de les exécuter de manière transparente sur une autre, éliminant ainsi le besoin de modifier le code.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formats de fichiers pris en charge

Aspose.OCR for Python via Java peut fonctionner avec pratiquement n’importe quel fichier vous pouvez l’obtenir à partir d’un scanner ou d’un appareil photo. Les résultats de la reconnaissance sont renvoyés dans les formats d’échange de fichiers et de données les plus courants qui peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.

Images

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

ROC par lots

  • Multi-page PDF
  • ZIP
  • Folder

Résultats de reconnaissance

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installation sans effort pour Python via Java

Aspose.OCR pour Python via Java est fourni sous forme de package Python ou sous forme de fichier téléchargeable avec un minimum de dépendances. Installez-le facilement dans votre projet et vous êtes prêt à reconnaître des textes dans plusieurs langues prises en charge et à enregistrer les résultats de la reconnaissance dans différents formats.

Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle et sans limitations.

OCR puissant pour les applications Python

Notre bibliothèque s’intègre facilement, permettant aux applications Python de s’exécuter de manière transparente sur n’importe quelle plateforme : ordinateur de bureau Windows, Windows Server, macOS, Linux et cloud.

28 langues de reconnaissance

Notre API Python et Java OCR reconnaît une multitude de langages et de scripts d’écriture populaires, y compris des langages mixtes :

Laissez la détection de langue à la bibliothèque ou définissez la langue vous-même pour des performances et une fiabilité de reconnaissance améliorées.

  • Alphabet latin étendu : croate, tchèque, danois, néerlandais, anglais, estonien, finnois, français, allemand, italien, letton, lituanien, norvégien, polonais, portugais, roumain, slovaque, slovène, espagnol, suédois ;
  • Alphabet cyrillique : biélorusse, bulgare, kazakh, russe, serbe, ukrainien ;
  • Chinois : plus de 6 000 caractères ;
  • Hindi.

Filtres de traitement d’image améliorés

La précision de la reconnaissance optique des caractères dépend fortement de la qualité de l’image originale. Aspose.OCR pour Python via Java propose une large gamme de filtres de traitement d’image automatisés et manuels pour optimiser une image avant de la soumettre au moteur OCR :

  • Redressez automatiquement les images légèrement inclinées.
  • Corrigez manuellement la rotation des images fortement asymétriques.
  • Supprimez automatiquement la saleté, les taches, les rayures, les reflets, les dégradés indésirables et autres types de bruit.
  • Ajustez automatiquement le contraste de l’image.
  • Améliorez automatiquement ou redimensionnez manuellement l’image.
  • Convertissez les images en noir et blanc ou en niveaux de gris.
  • Inversez les couleurs de l’image, en faisant apparaître les zones claires comme sombres et les zones sombres comme claires.
  • Augmentez l’épaisseur des caractères dans une image.
  • Floutez les images bruyantes tout en préservant les bords des lettres.
  • Redressez l’inclinaison de la page et corrigez la distorsion de l’objectif de l’appareil photo dans les photos de la page.

API spécialisées pour différents types de documents

Aspose.OCR pour Python via Java propose des réseaux de neurones spécialement entraînés pour extraire le texte de certains types d’images avec une précision maximale :

  • Cartes d’identité et passeports scannés ou photographiés.
  • Plaques d’immatriculation des véhicules.
  • Factures.
  • Reçus.

Correcteur orthographique intégré

Bien qu’Aspose.OCR pour Python via Java offre une précision de reconnaissance élevée, des défauts d’impression, de la saleté ou des polices non standard peuvent entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer le correcteur orthographique, qui recherche et corrige automatiquement les fautes d’orthographe en fonction de la langue de reconnaissance sélectionnée.

Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires orthographiques courants, vous pouvez fournir vos propres listes de mots.

Reconnaissance efficace des lots

Notre API Python OCR vous permet de rationaliser la reconnaissance d’images. Utilisez des méthodes polyvalentes de traitement par lots pour un traitement efficace de plusieurs images en un seul appel :

  • Reconnaître les fichiers PDF et TIFF de plusieurs pages.
  • Traitez tous les fichiers d’un dossier.
  • Gérer la reconnaissance de tous les fichiers d’une archive.
  • Reconnaître les images d’une liste spécifiée.

Apprendre via des exemples Python

Explorez une variété d’ exemples Python conçus pour vous aider à comprendre rapidement les fonctions et les capacités de notre solution OCR. Obtenez rapidement des informations sur la création de solutions personnalisées qui répondent aux besoins spécifiques de votre entreprise.

Caractéristiques et capacités

Aspose.OCR for Python via Java Explorez les fonctionnalités avancées d’Aspose.OCR pour Python

Feature icon

ROC de photos

Extrayez le texte des photos de votre smartphone avec une précision de niveau numérisation.

Feature icon

PDF consultable

Convertissez n’importe quelle numérisation en un document entièrement consultable et indexable.

Feature icon

Reconnaissance d’URL

Reconnaissez une image à partir d’une URL sans la télécharger localement.

Feature icon

Reconnaissance groupée

Lisez toutes les images de documents, dossiers et archives de plusieurs pages.

Feature icon

N’importe quelle police et style

Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.

Feature icon

Affiner la reconnaissance

Ajustez chaque paramètre OCR pour obtenir les meilleurs résultats de reconnaissance.

Feature icon

Correcteur orthographique

Améliorez les résultats en corrigeant automatiquement les mots mal orthographiés.

Feature icon

Rechercher du texte dans les images

Recherchez du texte ou une expression régulière dans un ensemble d’images.

Feature icon

Comparer les textes des images

Comparez les textes sur deux images, quels que soient la casse et la mise en page.

Exemples de code Python

Découvrez des exemples de code pour intégrer de manière transparente Aspose.OCR pour Python via Java dans vos applications.

Installation sans effort

En tant que package Python ou fichier téléchargeable avec un minimum de dépendances, Aspose.OCR pour Python via Java garantit une distribution facile. Intégrez-le dans votre projet directement depuis Python et vous êtes prêt à exploiter toutes les capacités OCR, en enregistrant les résultats de reconnaissance dans différents formats.

Après l’installation, commencez rapidement à utiliser Aspose.OCR pour Python via Java, mais avec certaines limites. Une licence temporaire supprime toutes les restrictions de la version d’essai pendant 30 jours. Profitez de cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée concernant l’achat ultérieur d’Aspose.OCR pour Python via Java.

Charger la licence

lic = License()
lic.set_license(self.licPath)

Reconnaissance d’images

Le principal défi des applications OCR est la rareté des scanners pour les utilisateurs finaux. Notre API, parfaitement intégrée à Python via Java, comprend de robustes filtres de prétraitement d’image intégrés gérant les images pivotées, asymétriques et bruyantes. Combiné à la prise en charge de tous les formats d’images, il permet une reconnaissance fiable, même à partir de photos de smartphone. La plupart des prétraitements et corrections d’images sont automatisés, ne nécessitant votre intervention que dans les cas difficiles.

Appliquer des corrections d'image automatiques - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Convertisseur universel Python

Notre API lit efficacement n’importe quelle image provenant de scanners, d’appareils photo ou de smartphones : documents PDF, fichiers JPEG, PNG, TIFF, GIF, BMP. La prise en charge complète des documents PDF de plusieurs pages, des images TIFF et DjVu garantit la polyvalence. Vous pouvez également fournir une image du Web via une URL.

Les résultats de la reconnaissance sont renvoyés dans des formats d’échange de documents et de données courants : texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.

Reconnaître le PDF et enregistrer les résultats dans différents formats de sortie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimiser l’utilisation des ressources

OCR propose un algorithme de reconnaissance spécial pour extraire le contenu d’images comportant du texte clairsemé et des arrière-plans bruyants/colorés. Cette méthode améliore considérablement la précision de l’OCR dans les analyses de rentabilisation suivantes :

  • Lisez le texte des photos de rue.
  • Segmentez et identifiez les panneaux routiers et les panneaux dans les images de rue.
  • Localisez les étiquettes de prix et interprétez le texte extrait comme des prix.
  • Recherchez et regroupez les régions d'intérêt sur les étiquettes des aliments, telles que les informations nutritionnelles ou les listes d'ingrédients.
  • Identifier et analyser les plaques d'immatriculation des voitures.
  • Extrayez le texte des menus et des catalogues.

OCR en zone ouverte - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extraire du texte à partir de photos de rue

OCR pour Python propose un algorithme de reconnaissance spécial qui extrait le texte des plaques d’immatriculation des véhicules, y compris les photos sombres et floues. Le texte résultant peut ensuite être automatiquement enregistré dans la base de données ou automatiquement vérifié.

Reconnaître le numéro de voiture - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)