traite les images numérisées ou même les photos de smartphone au format WBMP et crée des documents WBMP contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR
Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Avec Java OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image WBMP en document DOCX :
- Créer une instance de la classe AsposeOcr
- Appelez la méthode AsposeOCR.RecognizePage
- Passez le chemin du fichier WBMP en paramètre
- AsposeOCR.RecognizePage renvoie une chaîne ou un fichier de type DOCX
Configuration requise
Avant d’exécuter l’exemple, assurez-vous que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou version ultérieure est installé sur votre système.
- JDK 1.6 ou supérieur est installé.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
WBMP Qu'est-ce que WBMP Format de fichier
WBMP est un format de fichier graphique monochrome optimisé pour les appareils informatiques mobiles. Les images WBMP sont monochromes (noir et blanc) afin que la taille de l'image soit réduite au minimum. Un pixel noir est noté 0 et un pixel blanc est noté 1.
Lire la suiteDOCX Qu'est-ce que DOCX Format de fichier
DOCX est un format bien connu pour les documents Microsoft Word. Introduit à partir de 2007 avec la sortie de Microsoft Office 2007, la structure de ce nouveau format de document est passée de binaire brut à une combinaison de fichiers XML et binaires. Les fichiers Docx peuvent être ouverts avec Word 2007 et les versions latérales, mais pas avec les versions antérieures de MS Word qui prennent en charge les extensions de fichier DOC.
Lire la suite