Pourquoi aspose.ocr pour Python via Java?

Aspose.ocr pour Python via Java intègre de puissantes capacités de reconnaissance de caractères optiques (OCR) dans vos cahiers et applications Python multiplateforme. Avec notre API intuitive et à grande vitesse, vous pouvez extraire sans effort du texte des analyses, des captures d’écran, des liens Web ou des photos de smartphone, en fournissant des résultats prêts à la consolidation, à l’analyse ou au stockage. Reconnaissez les images numérisées, les photos de smartphones, les captures d’écran et les PDF numérisés, les résultats de l’enregistrement dans des formats de documents populaires. Les filtres de prétraitement avancés gèrent des images tournées, biaisées et bruyantes. Optimiser les performances en déchargeant les tâches au GPU.

Illustration ocr

OCR rapide et précis

Atteignez les résultats OCR à grande vitesse et précis avec notre Python avancé via la technologie Java.

Support multilingue

Reconnaissez le texte dans 140+ langues, y compris les scripts latine, cyrillique, arabe, persan, indic et chinois, garantissant la polyvalence pour vos applications python via Java.

Support d'image flexible

Traitez les images des scanners, des caméras et des smartphones de manière transparente avec Python via Java.

Précision dans la reconnaissance du caractère chinois

Reconnaissez plus de 6 000 caractères chinois avec précision dans vos projets Python via Java.

Conserver les styles de police et la mise en forme

Maintenez les styles de police et le formatage pour une représentation précise du texte reconnu dans vos applications Python via Java.

Exemple de code en direct

Lancer la reconnaissance de texte à partir d’images en seulement trois lignes de code. Découvrez la simplicité!

Prêt à reconnaître Prêt à reconnaître Déposez un fichier ici ou cliquez pour parcourir *

* En téléchargeant vos fichiers ou en utilisant le service avec lequel vous êtes d'accord avec notre Conditions d'utilisation et politique de confidentialité.

Résultat de reconnaissance
 

Convertir l'image en texte

Plus d'exemples >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Choisissez votre préférence

Choisissez la bonne bibliothèque pour vos besoins. Explorez les API disponibles et leurs capacités pour sélectionner la solution la plus efficace.

Versatilité

Python via .NET

Développement, lisibilité et maintenabilité faciles du code
Possède le plus de fonctionnalités et reçoit les mises à jour les plus fréquentes
La vitesse globale peut être un peu plus lente que les autres plates-formes

Uniformité

Python via Java

Utilisez la même bibliothèque sur n’importe quelle plate-forme
Exécutez de manière transparente votre application sur n’importe quel appareil
Nécessite le Java Runtime Environment (JRE) version 8 ou version ultérieure

Performance

Python via C++

La vitesse la plus rapide possible quelle que soit la plate-forme
Beaucoup de contrôle sur la gestion des ressources
Ciblé vers les développeurs expérimentés

Compatibilité du backend Java

Conçu comme un module Python, notre bibliothèque garantit une compatibilité entre les principaux systèmes d’exploitation prenant en charge Java - y compris Microsoft Windows, Linux et MacOS, ou les plates-formes cloud. Cela vous permet de développer des applications sur une plate-forme et de les exécuter de manière transparente sur une autre, éliminant le besoin de modifications de code.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formats de fichiers pris en charge

Aspose.OCR for Python via Java peut fonctionner avec n’importe quel fichier Vous pouvez obtenir à partir d’un scanner ou d’une caméra. Les résultats de reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.

Images

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR par lots

  • Multi-page PDF
  • ZIP
  • Folder

Résultats de la reconnaissance

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Installation sans effort pour Python via Java

Aspose.ocr pour Python via Java est livré en tant que package Python ou comme un fichier téléchargeable avec des dépendances minimales. Facilement installer It dans votre projet, et vous êtes prêt à reconnaître les textes dans plusieurs langues prises en charge et à économiser des résultats de reconnaissance dans divers formats.

Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle sans limites.

OCR puissant pour les applications Python

Notre bibliothèque s’intègre facilement, permettant aux applications Python d’exécuter de manière transparente sur n’importe quelle plate-forme - Windows, Windows Server, MacOS, Linux et le cloud.

140+ langues de reconnaissance

Notre API Python et Java OCR reconnaît une pléthore de langues et de scripts d’écriture populaires, y compris les langues mixtes:

Laissez la détection du langage à la bibliothèque ou définissez le langage vous-même pour une amélioration des performances et de la fiabilité de la reconnaissance.

  • ** Latin étendu ** Alphabet: anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et 80+ de plus;
  • ** Cyrillic ** Alphabet: russe, ukrainien, kazakh, serbe, biélorusse, bulgare;
  • Arabe, persan, ourdou;
  • Script chinois et Devanagari, notamment en hindi, marathi, bhojpuri et autres.

Filtres de traitement d’image améliorés

La précision de la reconnaissance optique des caractères repose fortement sur la qualité de l’image d’origine. Aspose.ocr pour Python via Java propose un large éventail de filtres de traitement d’image automatisés et manuels pour optimiser une image avant de se soumettre au moteur OCR:

  • Redresser automatiquement les images légèrement inclinées.
  • Corrigez manuellement la rotation des images sévèrement asymétriques.
  • Retirez automatiquement la saleté, les taches, les rayures, l’éblouissement, les gradients indésirables et d’autres types de bruit.
  • Ajustez automatiquement le contraste d’image.
  • Upsexation automatique ou redimensionner manuellement l’image.
  • Convertissez les images en noir et blanc ou en niveaux de gris.
  • Les couleurs de l’image inversées, faisant apparaître des zones claires et sombres, les zones sombres apparaissent claires.
  • Augmentez l’épaisseur des caractères dans une image.
  • Images bruyantes floues tout en préservant les bords des lettres.
  • Sinsionner la page de page et correctement la distorsion de l’objectif de l’appareil photo dans les photos de la page.

API spécifiées pour divers types de documents

Aspose.ocr pour Python via Java propose des réseaux de neurones spécialement formés pour extraire du texte de certains types d’images avec une précision maximale:

  • Les cartes d’identité numérisées ou photographiées et les passeports.
  • Plaques d’immatriculation du véhicule.
  • Factures.
  • Recettes.

Vérificateur orthographique intégré

Bien qu’Aspose.ocr pour Python via Java fournit une précision de reconnaissance élevée, l’impression de défauts, de saleté ou de polices non standard peut entraîner une reconnaissance incorrectement de certains personnages ou mots. Pour améliorer encore les résultats de reconnaissance, vous pouvez activer Spell Checker, qui trouve et corrige automatiquement les erreurs d’orthographe en fonction du langage de reconnaissance sélectionné.

Si le texte reconnu contient une terminologie spécialisée, des abréviations et d’autres mots qui ne sont pas présents dans les dictionnaires d’orthographe communs, vous pouvez fournir vos propres listes de mots.

Reconnaissance efficace de lots

Notre API Python OCR vous permet de rationaliser la reconnaissance de l’image. Utilisez des méthodes polyvalentes de traitement par lots pour un traitement efficace de plusieurs images en un seul appel:

  • Reconnaissez les fichiers PDF de plusieurs pages, TIFF.
  • Traiter tous les fichiers dans un dossier.
  • Gérer la reconnaissance de tous les fichiers dans une archive.
  • Reconnaître les images d’une liste spécifiée.

Apprendre via des exemples Python

Explorez une variété de Python Exemples conçus pour vous aider à saisir rapidement les fonctions et les capacités de notre solution OCR. Gardez rapidement un aperçu de la création de solutions personnalisées qui répondent à vos besoins commerciaux spécifiques.

Caractéristiques et capacités

Aspose.OCR for Python via Java Explorez les fonctionnalités avancées d’Aspose.ocr pour Python

Feature icon

Photo OCR

Extraire le texte des photos du smartphone avec précision au niveau scan.

Feature icon

PDF consultable

Convertissez toute analyse en document entièrement consultable et indexable.

Feature icon

Reconnaissance de l’URL

Reconnaissez une image de l’URL sans la télécharger localement.

Feature icon

Reconnaissance en vrac

Lisez toutes les images de documents, dossiers et archives de plusieurs pages.

Feature icon

Toute police et style

Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.

Feature icon

Reconnaissance de tonnelle

Ajustez chaque paramètre OCR pour les meilleurs résultats de reconnaissance.

Feature icon

Vérificateur orthographique

Améliorer les résultats en corrigeant automatiquement les mots mal orthographiés.

Feature icon

Trouver du texte dans les images

Recherchez du texte ou de l’expression régulière dans un ensemble d’images.

Feature icon

Comparez les textes de l’image

Comparez les textes sur deux images, quel que soit le cas et la mise en page.

Échantillons de code python

Découvrez des échantillons de code pour intégrer de manière transparente Aspose.ocr pour Python via Java dans vos applications.

Installation sans effort

En tant que package Python ou un fichier téléchargeable avec des dépendances minimales, Aspose.ocr pour Python via Java assure une distribution facile. Intégrez-le dans votre projet directement à partir de Python, et vous êtes prêt à tirer parti des capacités d’OCR complètes, la reconnaissance de l’enregistrement des résultats dans divers formats.

post-installation, commencez rapidement en utilisant Aspose.ocr pour Python via Java, bien qu’avec certaines limites. Une licence temporaire supprime toutes les restrictions de version d’essai pendant 30 jours. Utilisez cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée sur l’achat d’aspose.ocr pour Python via Java plus tard.

Licence de chargement

lic = License()
lic.set_license(self.licPath)

Reconnaissance d’image

Le principal défi dans les applications OCR est la rareté des scanners pour les utilisateurs finaux. Notre API, intégrée de manière transparente à Python via Java, propose des filtres de prétraitement d’image intégrés robustes manipulant des images tournées, biaisées et bruyantes. Combiné avec la prise en charge de tous les formats d’image, il permet une reconnaissance fiable, même à partir des photos du smartphone. La plupart des prétraitements et la correction d’images sont automatisés, ne nécessitant votre intervention que dans des cas difficiles.

Appliquer des corrections d'image automatiques - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Convertisseur universel Python

Notre API lit avec toute l’image des scanners, des caméras ou des smartphones: documents PDF, fichiers JPEG, PNG, TIFF, GIF, BMP. La prise en charge complète des documents PDF de plusieurs pages, les images TIFF et DJVU assure la polyvalence. Vous pouvez également fournir une image du Web via une URL.

Les résultats de reconnaissance sont renvoyés dans des formats de documents et d’échange de données populaires: texte brut, PDF, Microsoft Word, Microsoft Excel, JSON et XML.

Reconnaître le PDF et enregistrer les résultats vers divers formats de sortie - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimisation de l’utilisation des ressources

OCR propose un algorithme de reconnaissance spécial pour extraire du contenu à partir d’images avec du texte clairsemé et des arrière-plans bruyants / colorés. Cette méthode améliore considérablement la précision de l’OCR dans les analyses de rentabilisation suivantes:

  • Lisez le texte des photos de rue.
  • Segmenter et identifier les panneaux de route et les panneaux dans les images de rue.
  • Localisez les étiquettes de prix et interprétez le texte extrait comme des prix.
  • Trouvez et regroupez les régions d'intérêt sur les étiquettes alimentaires, telles que les informations nutritionnelles ou les listes d'ingrédients.
  • Identifier et analyser les plaques d'immatriculation automobiles.
  • Extraire le texte des menus et des catalogues.

OCR Open Area - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extraction de texte des photos de rue

OCR pour Python propose un algorithme de reconnaissance spécial qui extrait le texte des plaques d’immatriculation des véhicules, y compris les photos sombres et floues. Le texte résultant peut ensuite être enregistré automatiquement dans la base de données ou vérifié automatiquement.

Reconnaître le numéro de voiture - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)