HTML JPG OCR XML BMP
Aspose.OCR  pour Java
XML

Aspose.Imaging pour Java

traite les images numérisées ou même les photos de smartphone au format JPEG et crée des documents JPEG contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR

Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Avec Java OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image JPEG en document XML :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizePage
  • Passez le chemin du fichier JPEG en paramètre
  • AsposeOCR.RecognizePage renvoie une chaîne ou un fichier de type XML

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou version ultérieure est installé sur votre système.

  • JDK 1.6 ou supérieur est installé.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPEG Qu'est-ce que JPEG Format de fichier

    Un JPEG est un type de format d'image enregistré à l'aide de la méthode de compression avec perte. L'image de sortie, résultant de la compression, est un compromis entre la taille de stockage et la qualité de l'image. Les utilisateurs peuvent ajuster le niveau de compression pour atteindre le niveau de qualité souhaité tout en réduisant la taille de stockage. La qualité de l'image est négligeable si une compression 10:1 est appliquée à l'image. Plus la valeur de compression est élevée, plus la dégradation de la qualité de l'image est importante.

    Lire la suite

    XML Qu'est-ce que XML Format de fichier

    XML signifie Extensible Markup Language qui est similaire à HTML mais différent dans l'utilisation de balises pour définir des objets. L'idée derrière la création du format de fichier XML était de stocker et de transporter des données sans dépendre d'outils logiciels ou matériels. Sa popularité est due au fait qu'il est à la fois lisible par l'homme et par la machine. Cela lui permet de créer des protocoles de données communs sous la forme d'objets à stocker et à partager sur un réseau tel que le World Wide Web (WWW). Le "X" dans XML est pour extensible, ce qui implique que le langage peut être étendu à n'importe quel nombre de symboles selon les besoins de l'utilisateur. C'est pour ces fonctionnalités que de nombreux formats de fichiers standard l'utilisent, tels que Microsoft Open XML, LibreOffice OpenDocument, XHTML et SVG.

    Lire la suite

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)