HTML JPG OCR XML BMP
Aspose.OCR  pour Java
DOC

Aspose.Imaging pour Java

traite les images numérisées ou même les photos de smartphone au format GIF et crée des documents GIF contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR

Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Avec Java OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image GIF en document DOC :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizePage
  • Passez le chemin du fichier GIF en paramètre
  • AsposeOCR.RecognizePage renvoie une chaîne ou un fichier de type DOC

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou version ultérieure est installé sur votre système.

  • JDK 1.6 ou supérieur est installé.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • GIF Qu'est-ce que GIF Format de fichier

    Un format GIF ou Graphical Interchange est un type d'image hautement compressée. Propriété d'Unisys, GIF utilise l'algorithme de compression LZW qui ne dégrade pas la qualité de l'image. Pour chaque image, le GIF autorise généralement jusqu'à 8 bits par pixel et jusqu'à 256 couleurs sont autorisées sur l'image. Contrairement à une image JPEG, qui peut afficher jusqu'à 16 millions de couleurs et touche assez les limites de l'œil humain. À l'époque de l'émergence d'Internet, les GIF restaient le meilleur choix car ils nécessitaient une faible bande passante et étaient compatibles avec les graphiques qui consommaient des zones de couleur unies. Un GIF animé combine de nombreuses images ou cadres dans un seul fichier et les affiche dans une séquence pour générer un clip animé ou une courte vidéo. Les limitations de couleur vont jusqu'à 256 pour chaque image et sont probablement les moins appropriées pour reproduire d'autres images et photographies avec un dégradé de couleurs.

    Lire la suite

    DOC Qu'est-ce que DOC Format de fichier

    Les fichiers avec l'extension .doc représentent des documents générés par Microsoft Word ou d'autres documents de traitement de texte au format de fichier binaire. L'extension était initialement utilisée pour la documentation en texte brut sur plusieurs systèmes d'exploitation différents. Il peut contenir plusieurs types de données différents tels que des images, formatées ainsi que du texte brut, des graphiques, des tableaux, des objets intégrés, des liens, des pages, le formatage des pages, les paramètres d'impression et bien d'autres. Le format était populaire pour toutes sortes de documentation en raison de la variété d'options qu'il offre aux utilisateurs pour la rédaction de manuels, de propositions, de spécifications, de CV, d'articles ou de tout autre document similaire. La version mise à jour de DOC est DOCX qui est basée sur Office OpenXML dont les spécifications sont librement disponibles.

    Lire la suite

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)