Convertir l’image en texte avec l’API Python OCR via Java
Reconnaître le texte dans les images avec Python
Plus de vitrines ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Pourquoi aspose.ocr pour Python via Java?
Aspose.ocr pour Python via Java intègre de puissantes capacités de reconnaissance de caractères optiques (OCR) dans vos cahiers et applications Python multiplateforme. Avec notre API intuitive et à grande vitesse, vous pouvez extraire sans effort du texte des analyses, des captures d’écran, des liens Web ou des photos de smartphone, en fournissant des résultats prêts à la consolidation, à l’analyse ou au stockage. Reconnaissez les images numérisées, les photos de smartphones, les captures d’écran et les PDF numérisés, les résultats de l’enregistrement dans des formats de documents populaires. Les filtres de prétraitement avancés gèrent des images tournées, biaisées et bruyantes. Optimiser les performances en déchargeant les tâches au GPU.

OCR rapide et précis
Atteignez les résultats OCR à grande vitesse et précis avec notre Python avancé via la technologie Java.
Support multilingue
Reconnaissez le texte dans 140+ langues, y compris les scripts latine, cyrillique, arabe, persan, indic et chinois, garantissant la polyvalence pour vos applications python via Java.
Support d'image flexible
Traitez les images des scanners, des caméras et des smartphones de manière transparente avec Python via Java.
Précision dans la reconnaissance du caractère chinois
Reconnaissez plus de 6 000 caractères chinois avec précision dans vos projets Python via Java.
Conserver les styles de police et la mise en forme
Maintenez les styles de police et le formatage pour une représentation précise du texte reconnu dans vos applications Python via Java.
Exemple de code en direct
Lancer la reconnaissance de texte à partir d’images en seulement trois lignes de code. Découvrez la simplicité!
* En téléchargeant vos fichiers ou en utilisant le service avec lequel vous êtes d'accord avec notre Conditions d'utilisation et politique de confidentialité.
Convertir l'image en texte
Plus d'exemples ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Choisissez votre préférence
Choisissez la bonne bibliothèque pour vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.
Versatilité
Python via .NET
Uniformité
Python via Java
Performance
Python via C++
Compatibilité du backend Java
Conçu comme un module Python, notre bibliothèque garantit une compatibilité entre les principaux systèmes d’exploitation prenant en charge Java - y compris Microsoft Windows, Linux et MacOS, ou les plates-formes cloud. Cela vous permet de développer des applications sur une plate-forme et de les exécuter de manière transparente sur une autre, éliminant le besoin de modifications de code.
Formats de fichiers pris en charge
Aspose.OCR for Python via Java peut fonctionner avec n’importe quel fichier Vous pouvez obtenir à partir d’un scanner ou d’une caméra. Les résultats de reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.
Images
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR par lots
- Multi-page PDF
- ZIP
- Folder
Résultats de la reconnaissance
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation sans effort pour Python via Java
Aspose.ocr pour Python via Java est livré en tant que package Python ou comme un fichier téléchargeable avec des dépendances minimales. Facilement installer It dans votre projet, et vous êtes prêt à reconnaître les textes dans plusieurs langues prises en charge et à économiser des résultats de reconnaissance dans divers formats.
Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle sans limites.
OCR puissant pour les applications Python
Notre bibliothèque s’intègre facilement, permettant aux applications Python d’exécuter de manière transparente sur n’importe quelle plate-forme - Windows, Windows Server, MacOS, Linux et le cloud.
140+ langues de reconnaissance
Notre API Python et Java OCR reconnaît une pléthore de langues et de scripts d’écriture populaires, y compris les langues mixtes:
Laissez la détection du langage à la bibliothèque ou définissez le langage vous-même pour une amélioration des performances et de la fiabilité de la reconnaissance.
- ** Latin étendu ** Alphabet: anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et 80+ de plus;
- ** Cyrillic ** Alphabet: russe, ukrainien, kazakh, serbe, biélorusse, bulgare;
- Arabe, persan, ourdou;
- Script chinois et Devanagari, notamment en hindi, marathi, bhojpuri et autres.
Filtres de traitement d’image améliorés
La précision de la reconnaissance optique des caractères repose fortement sur la qualité de l’image d’origine. Aspose.ocr pour Python via Java propose un large éventail de filtres de traitement d’image automatisés et manuels pour optimiser une image avant de se soumettre au moteur OCR:
- Redresser automatiquement les images légèrement inclinées.
- Corrigez manuellement la rotation des images sévèrement asymétriques.
- Retirez automatiquement la saleté, les taches, les rayures, l’éblouissement, les gradients indésirables et d’autres types de bruit.
- Ajustez automatiquement le contraste d’image.
- Upsexation automatique ou redimensionner manuellement l’image.
- Convertissez les images en noir et blanc ou en niveaux de gris.
- Les couleurs de l’image inversées, faisant apparaître des zones claires et sombres, les zones sombres apparaissent claires.
- Augmentez l’épaisseur des caractères dans une image.
- Images bruyantes floues tout en préservant les bords des lettres.
- Sinsionner la page de page et correctement la distorsion de l’objectif de l’appareil photo dans les photos de la page.
API spécifiées pour divers types de documents
Aspose.ocr pour Python via Java propose des réseaux de neurones spécialement formés pour extraire du texte de certains types d’images avec une précision maximale:
- Les cartes d’identité numérisées ou photographiées et les passeports.
- Plaques d’immatriculation du véhicule.
- Factures.
- Recettes.
Vérificateur orthographique intégré
Bien qu’Aspose.ocr pour Python via Java fournit une précision de reconnaissance élevée, l’impression de défauts, de saleté ou de polices non standard peut entraîner une reconnaissance incorrectement de certains personnages ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer Spell Checker, qui trouve et corrige automatiquement les erreurs d’orthographe en fonction du langage de reconnaissance sélectionné.
Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires d’orthographe communs, vous pouvez fournir vos propres listes de mots.
Reconnaissance efficace de lots
Notre API Python OCR vous permet de rationaliser la reconnaissance de l’image. Utilisez des méthodes polyvalentes de traitement par lots pour un traitement efficace de plusieurs images en un seul appel:
- Reconnaissez les fichiers PDF de plusieurs pages, TIFF.
- Traiter tous les fichiers dans un dossier.
- Gérer la reconnaissance de tous les fichiers dans une archive.
- Reconnaître les images d’une liste spécifiée.
Apprendre via des exemples Python
Explorez une variété de Python Exemples conçus pour vous aider à saisir rapidement les fonctions et les capacités de notre solution OCR. Gardez rapidement un aperçu de la création de solutions personnalisées qui répondent à vos besoins commerciaux spécifiques.
Caractéristiques et capacités
Aspose.OCR for Python via Java Explorez les fonctionnalités avancées d’Aspose.ocr pour Python
Photo OCR
Extraire le texte des photos du smartphone avec précision au niveau scan.
PDF consultable
Convertissez toute analyse en document entièrement consultable et indexable.
Reconnaissance de l’URL
Reconnaissez une image de l’URL sans la télécharger localement.
Reconnaissance en vrac
Lisez toutes les images de documents, dossiers et archives de plusieurs pages.
Toute police et style
Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.
Reconnaissance de tonnelle
Ajustez chaque paramètre OCR pour les meilleurs résultats de reconnaissance.
Vérificateur orthographique
Améliorer les résultats en corrigeant automatiquement les mots mal orthographiés.
Trouver du texte dans les images
Recherchez du texte ou de l’expression régulière dans un ensemble d’images.
Comparez les textes de l’image
Comparez les textes sur deux images, quel que soit le cas et la mise en page.
Échantillons de code python
Découvrez des échantillons de code pour intégrer de manière transparente Aspose.ocr pour Python via Java dans vos applications.
Installation sans effort
En tant que package Python ou un fichier téléchargeable avec des dépendances minimales, Aspose.ocr pour Python via Java assure une distribution facile. Intégrez-le dans votre projet directement à partir de Python, et vous êtes prêt à tirer parti des capacités d’OCR complètes, la reconnaissance de l’enregistrement des résultats dans divers formats.
post-installation, commencez rapidement en utilisant Aspose.ocr pour Python via Java, bien qu’avec certaines limites. Une licence temporaire supprime toutes les restrictions de version d’essai pendant 30 jours. Utilisez cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée sur l’achat d’aspose.ocr pour Python via Java plus tard.
Licence de chargement
lic = License()
lic.set_license(self.licPath)
Reconnaissance d’image
Le principal défi dans les applications OCR est la rareté des scanners pour les utilisateurs finaux. Notre API, intégrée de manière transparente à Python via Java, propose des filtres de prétraitement d’image intégrés robustes manipulant des images tournées, biaisées et bruyantes. Combiné avec la prise en charge de tous les formats d’image, il permet une reconnaissance fiable, même à partir des photos du smartphone. La plupart des prétraitements et la correction d’images sont automatisés, ne nécessitant votre intervention que dans des cas difficiles.
Appliquer des corrections d'image automatiques - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Convertisseur universel Python
Notre API lit avec toute l’image des scanners, des caméras ou des smartphones: documents PDF, fichiers JPEG, PNG, TIFF, GIF, BMP. La prise en charge complète des documents PDF de plusieurs pages, les images TIFF et DJVU assure la polyvalence. Vous pouvez également fournir une image du Web via une URL.
Les résultats de reconnaissance sont renvoyés dans des formats de documents et d’échange de données populaires: texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.
Reconnaître le PDF et enregistrer les résultats vers divers formats de sortie - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimisation de l’utilisation des ressources
OCR propose un algorithme de reconnaissance spécial pour extraire du contenu à partir d’images avec du texte clairsemé et des arrière-plans bruyants / colorés. Cette méthode améliore considérablement la précision de l’OCR dans les analyses de rentabilisation suivantes:
- Lisez le texte des photos de rue.
- Segmenter et identifier les panneaux de route et les panneaux dans les images de rue.
- Localisez les étiquettes de prix et interprétez le texte extrait comme des prix.
- Trouvez et regroupez les régions d'intérêt sur les étiquettes alimentaires, telles que les informations nutritionnelles ou les listes d'ingrédients.
- Identifier et analyser les plaques d'immatriculation automobiles.
- Extraire le texte des menus et des catalogues.
OCR Open Area - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extraction de texte des photos de rue
OCR pour Python propose un algorithme de reconnaissance spécial qui extrait le texte des plaques d’immatriculation des véhicules, y compris les photos sombres et floues. Le texte résultant peut ensuite être enregistré automatiquement dans la base de données ou vérifié automatiquement.
Reconnaître le numéro de voiture - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)