Maîtrise de la conversion image en texte avec Python via Java
Reconnaître le texte dans les images avec Python
Plus de vitrines ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Pourquoi Aspose.OCR pour Python via Java ?
Aspose.OCR pour Python via Java intègre de manière transparente de puissantes fonctionnalités de reconnaissance optique de caractères (OCR) dans vos blocs-notes et applications Python multiplateformes. Grâce à notre API intuitive et rapide, vous pouvez facilement extraire du texte à partir de numérisations, de captures d’écran, de liens Web ou de photos de smartphone, fournissant ainsi des résultats prêts à être consolidés, analysés ou stockés. Reconnaissez les images numérisées, les photos de smartphone, les captures d’écran et les PDF numérisés, en enregistrant les résultats dans des formats de documents courants. Les filtres de prétraitement avancés gèrent les images pivotées, asymétriques et bruitées. Optimisez les performances en déchargeant les tâches sur le GPU.
OCR rapide et précis
Obtenez des résultats OCR rapides et précis grâce à notre technologie avancée Python via Java.
Prise en charge multilingue
Reconnaissez le texte dans plus de 130 langues, notamment les scripts latin, cyrillique, arabe, persan, indien et chinois, garantissant ainsi la polyvalence de vos applications Python via Java.
Prise en charge flexible des images
Traitez les images des scanners, des appareils photo et des smartphones de manière transparente avec Python via Java.
Précision dans la reconnaissance des caractères chinois
Reconnaissez plus de 6 000 caractères chinois avec précision dans vos projets Python via Java.
Conserver les styles de police et le formatage
Conservez les styles de police et le formatage pour une représentation précise du texte reconnu dans vos applications Python via Java.
Exemple de code en direct
Initiez la reconnaissance de texte à partir d’images en seulement trois lignes de code. Découvrez la simplicité !
* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez notre Conditions d'utilisation et politique de confidentialité.
Convertir l'image en texte
Plus d'exemples ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Choisissez votre préférence
Choisissez la bibliothèque adaptée à vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.
Polyvalence
Python via .NET
Uniformité
Python via Java
Performance
Python via C++
Compatibilité du back-end Java
Conçue comme un module Python, notre bibliothèque garantit la compatibilité avec les principaux systèmes d’exploitation prenant en charge Java - y compris Microsoft Windows, Linux et macOS, ou le plateformes cloud. Cela vous permet de développer des applications sur une plate-forme et de les exécuter de manière transparente sur une autre, éliminant ainsi le besoin de modifier le code.
Formats de fichiers pris en charge
Aspose.OCR for Python via Java peut fonctionner avec pratiquement n’importe quel fichier vous pouvez l’obtenir à partir d’un scanner ou d’un appareil photo. Les résultats de la reconnaissance sont renvoyés dans les formats d’échange de fichiers et de données les plus courants qui peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.
Images
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
ROC par lots
- Multi-page PDF
- ZIP
- Folder
Résultats de reconnaissance
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation sans effort pour Python via Java
Aspose.OCR pour Python via Java est fourni sous forme de package Python ou sous forme de fichier téléchargeable avec un minimum de dépendances. Installez-le facilement dans votre projet et vous êtes prêt à reconnaître des textes dans plusieurs langues prises en charge et à enregistrer les résultats de la reconnaissance dans différents formats.
Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle et sans limitations.
OCR puissant pour les applications Python
Notre bibliothèque s’intègre facilement, permettant aux applications Python de s’exécuter de manière transparente sur n’importe quelle plateforme : ordinateur de bureau Windows, Windows Server, macOS, Linux et cloud.
Plus de 130 langues de reconnaissance
Notre API Python et Java OCR reconnaît une multitude de langages et de scripts d’écriture populaires, y compris des langages mixtes :
Laissez la détection de langue à la bibliothèque ou définissez la langue vous-même pour des performances et une fiabilité de reconnaissance améliorées.
- Alphabet latin étendu : anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et plus de 80 autres ;
- Alphabet cyrillique : russe, ukrainien, kazakh, serbe, biélorusse, bulgare ;
- arabe, persan, ourdou ;
- Écriture chinoise et devanagari, notamment hindi, marathi, bhojpuri et autres.
Filtres de traitement d’image améliorés
La précision de la reconnaissance optique des caractères dépend fortement de la qualité de l’image originale. Aspose.OCR pour Python via Java propose une large gamme de filtres de traitement d’image automatisés et manuels pour optimiser une image avant de la soumettre au moteur OCR :
- Redressez automatiquement les images légèrement inclinées.
- Corrigez manuellement la rotation des images fortement asymétriques.
- Supprimez automatiquement la saleté, les taches, les rayures, les reflets, les dégradés indésirables et autres types de bruit.
- Ajustez automatiquement le contraste de l’image.
- Améliorez automatiquement ou redimensionnez manuellement l’image.
- Convertissez les images en noir et blanc ou en niveaux de gris.
- Inversez les couleurs de l’image, en faisant apparaître les zones claires comme sombres et les zones sombres comme claires.
- Augmentez l’épaisseur des caractères dans une image.
- Floutez les images bruyantes tout en préservant les bords des lettres.
- Redressez l’inclinaison de la page et corrigez la distorsion de l’objectif de l’appareil photo dans les photos de la page.
API spécialisées pour différents types de documents
Aspose.OCR pour Python via Java propose des réseaux de neurones spécialement entraînés pour extraire le texte de certains types d’images avec une précision maximale :
- Cartes d’identité et passeports scannés ou photographiés.
- Plaques d’immatriculation des véhicules.
- Factures.
- Reçus.
Correcteur orthographique intégré
Bien qu’Aspose.OCR pour Python via Java offre une précision de reconnaissance élevée, des défauts d’impression, de la saleté ou des polices non standard peuvent entraîner une reconnaissance incorrecte de certains caractères ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer le correcteur orthographique, qui recherche et corrige automatiquement les fautes d’orthographe en fonction de la langue de reconnaissance sélectionnée.
Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires orthographiques courants, vous pouvez fournir vos propres listes de mots.
Reconnaissance efficace des lots
Notre API Python OCR vous permet de rationaliser la reconnaissance d’images. Utilisez des méthodes polyvalentes de traitement par lots pour un traitement efficace de plusieurs images en un seul appel :
- Reconnaître les fichiers PDF et TIFF de plusieurs pages.
- Traitez tous les fichiers d’un dossier.
- Gérer la reconnaissance de tous les fichiers d’une archive.
- Reconnaître les images d’une liste spécifiée.
Apprendre via des exemples Python
Explorez une variété d’ exemples Python conçus pour vous aider à comprendre rapidement les fonctions et les capacités de notre solution OCR. Obtenez rapidement des informations sur la création de solutions personnalisées qui répondent aux besoins spécifiques de votre entreprise.
Caractéristiques et capacités
Aspose.OCR for Python via Java Explorez les fonctionnalités avancées d’Aspose.OCR pour Python
ROC de photos
Extrayez le texte des photos de votre smartphone avec une précision de niveau numérisation.
PDF consultable
Convertissez n’importe quelle numérisation en un document entièrement consultable et indexable.
Reconnaissance d’URL
Reconnaissez une image à partir d’une URL sans la télécharger localement.
Reconnaissance groupée
Lisez toutes les images de documents, dossiers et archives de plusieurs pages.
N’importe quelle police et style
Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.
Affiner la reconnaissance
Ajustez chaque paramètre OCR pour obtenir les meilleurs résultats de reconnaissance.
Correcteur orthographique
Améliorez les résultats en corrigeant automatiquement les mots mal orthographiés.
Rechercher du texte dans les images
Recherchez du texte ou une expression régulière dans un ensemble d’images.
Comparer les textes des images
Comparez les textes sur deux images, quels que soient la casse et la mise en page.
Exemples de code Python
Découvrez des exemples de code pour intégrer de manière transparente Aspose.OCR pour Python via Java dans vos applications.
Installation sans effort
En tant que package Python ou fichier téléchargeable avec un minimum de dépendances, Aspose.OCR pour Python via Java garantit une distribution facile. Intégrez-le dans votre projet directement depuis Python et vous êtes prêt à exploiter toutes les capacités OCR, en enregistrant les résultats de reconnaissance dans différents formats.
Après l’installation, commencez rapidement à utiliser Aspose.OCR pour Python via Java, mais avec certaines limites. Une licence temporaire supprime toutes les restrictions de la version d’essai pendant 30 jours. Profitez de cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée concernant l’achat ultérieur d’Aspose.OCR pour Python via Java.
Charger la licence
lic = License()
lic.set_license(self.licPath)
Reconnaissance d’images
Le principal défi des applications OCR est la rareté des scanners pour les utilisateurs finaux. Notre API, parfaitement intégrée à Python via Java, comprend de robustes filtres de prétraitement d’image intégrés gérant les images pivotées, inclinées et bruyantes. Combiné à la prise en charge de tous les formats d’images, il permet une reconnaissance fiable, même à partir de photos de smartphone. La plupart des prétraitements et corrections d’images sont automatisés, ne nécessitant votre intervention que dans les cas difficiles.
Appliquer des corrections d'image automatiques - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Convertisseur universel Python
Notre API lit efficacement n’importe quelle image provenant de scanners, d’appareils photo ou de smartphones : documents PDF, fichiers JPEG, PNG, TIFF, GIF, BMP. La prise en charge complète des documents PDF de plusieurs pages, des images TIFF et DjVu garantit la polyvalence. Vous pouvez également fournir une image du Web via une URL.
Les résultats de la reconnaissance sont renvoyés dans des formats d’échange de documents et de données courants : texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.
Reconnaître le PDF et enregistrer les résultats dans différents formats de sortie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimiser l’utilisation des ressources
OCR propose un algorithme de reconnaissance spécial pour extraire le contenu d’images comportant du texte clairsemé et des arrière-plans bruyants/colorés. Cette méthode améliore considérablement la précision de l’OCR dans les analyses de rentabilisation suivantes :
- Lisez le texte des photos de rue.
- Segmentez et identifiez les panneaux routiers et les panneaux dans les images de rue.
- Localisez les étiquettes de prix et interprétez le texte extrait comme des prix.
- Recherchez et regroupez les régions d'intérêt sur les étiquettes des aliments, telles que les informations nutritionnelles ou les listes d'ingrédients.
- Identifier et analyser les plaques d'immatriculation des voitures.
- Extrayez le texte des menus et des catalogues.
OCR en zone ouverte - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extraire du texte à partir de photos de rue
OCR pour Python propose un algorithme de reconnaissance spécial qui extrait le texte des plaques d’immatriculation des véhicules, y compris les photos sombres et floues. Le texte résultant peut ensuite être automatiquement enregistré dans la base de données ou automatiquement vérifié.
Reconnaître le numéro de voiture - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)