HTML JPG OCR XML BMP
Aspose.OCR  pour Java
TXT

Aspose.Imaging pour Java

traite les images numérisées ou même les photos de smartphone au format WBMP et crée des documents WBMP contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR

Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Avec Java OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image WBMP en document TXT :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizePage
  • Passez le chemin du fichier WBMP en paramètre
  • AsposeOCR.RecognizePage renvoie une chaîne ou un fichier de type TXT

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou version ultérieure est installé sur votre système.

  • JDK 1.6 ou supérieur est installé.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • WBMP Qu'est-ce que WBMP Format de fichier

    WBMP est un format de fichier graphique monochrome optimisé pour les appareils informatiques mobiles. Les images WBMP sont monochromes (noir et blanc) afin que la taille de l'image soit réduite au minimum. Un pixel noir est noté 0 et un pixel blanc est noté 1.

    Lire la suite

    TXT Qu'est-ce que TXT Format de fichier

    Un fichier avec l'extension .TXT représente un document texte qui contient du texte brut sous forme de lignes. Les paragraphes d'un document texte sont reconnus par des retours chariot et sont utilisés pour une meilleure organisation du contenu du fichier. Un document texte standard peut être ouvert dans n'importe quel éditeur de texte ou application de traitement de texte sur différents systèmes d'exploitation. Tout le texte contenu dans un tel fichier est dans un format lisible par l'homme et représenté par une séquence de caractères.

    Lire la suite

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)