traite les images numérisées ou même les photos de smartphone au format JPEG2000 et crée des documents JPEG2000 contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR
Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Avec Java OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image JPEG2000 en document Searchable PDF :
- Créer une instance de la classe AsposeOcr
- Appelez la méthode AsposeOCR.RecognizePage
- Passez le chemin du fichier JPEG2000 en paramètre
- AsposeOCR.RecognizePage renvoie une chaîne ou un fichier de type Searchable PDF
Configuration requise
Avant d’exécuter l’exemple, assurez-vous que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou version ultérieure est installé sur votre système.
- JDK 1.6 ou supérieur est installé.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
JPEG2000 Qu'est-ce que JPEG2000 Format de fichier
JPEG 2000 (JP2) est un système de codage d'image et une norme de compression d'image de pointe. Conçu en utilisant la technologie des ondelettes JPEG 2000 peut coder du contenu sans perte dans n'importe quelle qualité à la fois. De plus, sans aucune pénalité substantielle dans l'efficacité du codage, JPEG 2000 a la capacité d'accéder et de décoder efficacement le même contenu dans une variété d'autres résolutions et qualités. Les flux de code dans JPEG 2000 sont considérablement évolutifs, ayant des régions d'intérêt qui fournissent la possibilité d'un accès spatial aléatoire. Possédant jusqu'à 16384 composants divers avec des dimensions en térapixels, et une précision pouvant atteindre 38 bits/échantillon.
Lire la suiteSearchable PDF Qu'est-ce que Searchable PDF Format de fichier
Les fichiers PDF interrogeables conservent l'image numérisée d'origine pour l'affichage, ainsi que le texte OCR dans une couche masquée qui peut être utilisée pour les recherches en texte intégral dans un document ou la mise en surbrillance du texte pour les opérations de copier-coller. La conversion complète de l'OCR en PDF, sans inclure l'image d'origine, ne conservera jamais 100 % de la mise en forme d'origine, en particulier si le document contient de nombreuses images ou une mise en page complexe.
Lire la suite