HTML JPG OCR XML BMP
Aspose.OCR  pour Java
XLSX

Aspose.Imaging pour Java

traite les images numérisées ou même les photos de smartphone au format JPG et crée des documents JPG contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR

Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Avec Java OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image JPG en document XLSX :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizePage
  • Passez le chemin du fichier JPG en paramètre
  • AsposeOCR.RecognizePage renvoie une chaîne ou un fichier de type XLSX

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou version ultérieure est installé sur votre système.

  • JDK 1.6 ou supérieur est installé.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPG Qu'est-ce que JPG Format de fichier

    Un JPEG est un type de format d'image enregistré à l'aide de la méthode de compression avec perte. L'image de sortie, résultant de la compression, est un compromis entre la taille de stockage et la qualité de l'image. Les utilisateurs peuvent ajuster le niveau de compression pour atteindre le niveau de qualité souhaité tout en réduisant la taille de stockage. La qualité de l'image est négligeable si une compression 10:1 est appliquée à l'image. Plus la valeur de compression est élevée, plus la dégradation de la qualité de l'image est importante.

    Lire la suite

    XLSX Qu'est-ce que XLSX Format de fichier

    XLSX est un format bien connu pour les documents Microsoft Excel qui a été introduit par Microsoft avec la sortie de Microsoft Office 2007. Basé sur une structure organisée selon les conventions d'emballage ouvertes comme indiqué dans la partie 2 de la norme OOXML ECMA-376, le nouveau format est un package zip contenant un certain nombre de fichiers XML. La structure sous-jacente et les fichiers peuvent être examinés en décompressant simplement le fichier .xlsx.

    Lire la suite

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)