Image en texte avec l’API Java OCR
Transformer des images en texte en Java
Plus de vitrines >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Pourquoi choisir la bibliothèque Aspose OCR pour Java ?
Débloquez un OCR puissant avec la bibliothèque Java Aspose OCR. Notre API Java est une API OCR efficace, conviviale et rentable. En seulement cinq lignes de code Java, ajoutez de puissantes fonctionnalités OCR à vos applications sans avoir besoin de comprendre les réseaux neuronaux et d’autres détails techniques.
Notre moteur OCR offre une vitesse et une précision inégalées, prenant en charge plus de 130 langues, dont l’anglais. , cyrillique, arabe, persan, chinois, japonais, coréen, hindi, tamoul et bien d’autres. Que vous travailliez avec des numérisations, des photos de smartphone, des captures d’écran ou des PDF, notre OCR extrait le texte et génère des résultats dans tous les formats courants.
Le prétraitement des images corrige automatiquement les images pivotées, floues, inversées et bruyantes pour garantir la plus grande précision de reconnaissance sous toutes conditions.
![Illustration ocr](https://products.aspose.com/ocr/images/ocr/aspose-ocr.png)
OCR rapide et précis
Obtenez des résultats OCR rapides et précis grâce à notre technologie Java avancée.
Prise en charge multilingue
Reconnaissez le texte dans plus de 140 langues, dont l'anglais, le français, le cyrillique, l'arabe, le persan, l'indien, le chinois, le japonais, le coréen, le tamoul et d'autres écritures.
Toutes les images
Traitez des images provenant de diverses sources, telles que des scanners, des appareils photo et des smartphones.
Détection de langues mixtes
Reconnaître les documents rédigés dans des langues mixtes, telles que chinois/anglais, arabe/français, hindi/anglais et cyrillique/anglais.
N'importe quelle police, style et format
Préservez avec précision la disposition du texte, détectez la structure des tableaux et reconnaissez le texte de manière transparente, quels que soient les styles de police.
Exemple de code en direct
Découvrez la simplicité : transformez une image en texte en quelques lignes de code Java
* En téléchargeant vos fichiers ou en utilisant le service, vous acceptez notre Conditions d'utilisation et politique de confidentialité.
Convertir l'image en texte
Explorez plus d'exemples >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Multiplateforme
Le code Aspose Java OCR fonctionne de manière transparente sur n’importe quelle plate-forme prenant en charge Java SE 6.0 ou supérieur - qu’il s’agisse d’une machine locale, d’un serveur Web ou du cloud .
Formats de fichiers pris en charge
Aspose.OCR for Java peut fonctionner avec n’importe quel fichier vous pouvez l’obtenir à partir d’un scanner ou d’un appareil photo. Les résultats de la reconnaissance peuvent être enregistrés, importés dans une base de données ou analysés en temps réel.
Images
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
ROC par lots
- Multi-page PDF
- ZIP
- Folder
Résultats de reconnaissance
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Installation facile
Aspose.OCR pour Java est distribué sous forme de fichier Java Archive (JAR) léger ou sous forme de fichier téléchargeable avec un minimum de dépendances. Il suffit de l’installer dans votre projet, et vous êtes prêt à reconnaître des textes dans plusieurs langues prises en charge et à enregistrer les résultats de la reconnaissance dans différents formats.
Demander une licence d’essai pour lancer le développement d’une application OCR entièrement fonctionnelle et sans limitations.
Fonctionne partout
Notre bibliothèque Java prend entièrement en charge Java SE 6 ou version ultérieure, permettant à vos applications de s’exécuter de manière transparente sur n’importe quelle plateforme : ordinateur de bureau Windows, Windows Server, macOS, Linux et cloud.
Plus de 140 langues de reconnaissance
Notre bibliothèque Java OCR est une solution universelle pour le traitement de documents, l’extraction de données et la numérisation de contenu à l’échelle mondiale. Prenant en charge une vaste gamme de scripts d’écriture européens, du Moyen-Orient et d’Asie, il est bien adapté à tous les pays et à toutes les entreprises.
Aspose OCR pour Java reconnaît le texte dans les documents multilingues, tels que chinois/anglais, arabe/français ou cyrillique/anglais. Les langues suivantes sont prises en charge :
- Latin étendu : anglais, espagnol, français, indonésien, portugais, allemand, vietnamien, turc, italien, polonais et plus de 80 autres ;
- Alphabet cyrillique : russe, ukrainien, kazakh, bulgare, y compris des textes mixtes cyrillique/anglais ;
- arabe, persan, ourdou, y compris des textes mélangés à de l’anglais ;
- Langues chinoise, coréenne, japonaise, devanagari et dravidienne, dont l’hindi, le tamoul, le marathi et d’autres.
Caractéristiques et capacités
Aspose.OCR for Java Explorez les fonctionnalités et capacités avancées d’Aspose OCR pour Java.
ROC de photos
Extrayez le texte des photos de votre smartphone avec une précision de niveau numérisation.
PDF consultable
Convertissez n’importe quelle numérisation en un document consultable et modifiable.
Reconnaissance d’URL
Reconnaissez une image à partir d’une URL sans la télécharger localement.
Reconnaissance groupée
Lisez toutes les images de documents, dossiers et archives de plusieurs pages.
N’importe quelle police et style
Identifiez et reconnaissez le texte dans toutes les polices et styles populaires.
Affiner la reconnaissance
Ajustez chaque paramètre OCR pour obtenir les meilleurs résultats de reconnaissance.
Correcteur orthographique
Améliorez les résultats en corrigeant automatiquement les mots mal orthographiés.
Rechercher du texte dans les images
Recherchez du texte ou une expression régulière dans un ensemble d’images.
Comparer les textes des images
Comparez les textes sur deux images, quels que soient la casse et la mise en page.
Mondial
Extrayez le texte de n’importe quelle langue avec la détection automatique de la langue.
Extraction des détails clés
Extrayez automatiquement les détails importants des cartes d’identité.
Intégration complète avec les solutions Aspose
Intégrez l’OCR de manière transparente avec d’autres produits Aspose pour une solution Java complète et efficace.
Exemples de codes
Explorez les exemples de code pour apprendre à intégrer de manière transparente l’API OCR dans vos applications Java.
Installation
Après l’installation, vous pouvez rapidement commencer à utiliser Aspose.OMR pour Java. , mais avec certaines limites. Une licence temporaire lève toutes les restrictions de la version d’essai pendant 30 jours. Profitez de cette période pour lancer le développement d’une application OCR entièrement fonctionnelle, vous permettant de prendre une décision éclairée concernant l’achat d’Aspose.OCR pour Java à un stade ultérieur.
Reconnaître le texte sur les images numérisées en Java
Relevez le défi des applications OCR dépourvues de scanners répandus. Notre API dispose de puissants filtres de prétraitement d’image intégrés qui gèrent efficacement les images pivotées, inclinées et bruyantes. Combiné à la prise en charge de tous les formats d’image, il garantit une reconnaissance fiable même à partir des photos d’un smartphone. La plupart des prétraitements et corrections d’images sont automatisés, ne nécessitant votre intervention que dans les cas difficiles.
Appliquer des corrections d'image automatiques - Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Extraire le texte des photos en Java
Intégrez la détection et la reconnaissance de texte dans vos applications Java. Accédez facilement à des résultats précis à partir de photos, améliorant ainsi vos capacités de traitement d’image. Élevez les capacités de traitement d’image et obtenez des résultats précis à partir de photos.
Détecter et reconnaître le texte sur la photo - Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Optimisation des ressources en Java
La reconnaissance optique de caractères nécessite des ressources. Notre API offre des moyens flexibles d’équilibrer la triade classique temps-prix-qualité. Il vous permet de limiter le nombre de threads utilisés par le moteur de reconnaissance. Bien que cet ajustement puisse entraîner une vitesse de reconnaissance plus lente, il vous permet d’allouer des ressources à des tâches simultanées telles que le traitement d’images en parallèle, les opérations du serveur Web, la gestion de bases de données ou l’analyse des données d’arrière-plan.
- Choisissez entre une reconnaissance approfondie et une reconnaissance rapide.
- Spécifiez le nombre de threads alloués pour la reconnaissance ou autorisez la bibliothèque à s'adapter automatiquement au nombre de cœurs de processeur.
- Libérez le CPU en déchargeant les calculs sur le GPU.
Équilibrer l’utilisation des ressources
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
Reconnaissance rapide avec une configuration minimale
Si vos images sont des numérisations de haute qualité sans biais ni distorsion, vous pouvez utiliser le mode de reconnaissance le plus rapide qui consomme le minimum de ressources possible en utilisant :
OCR de reconnaissance rapide - Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});