HTML JPG OCR XML BMP
Aspose.OCR  pour Java
Searchable PDF

Aspose.Imaging pour Java

traite les images numérisées ou même les photos de smartphone au format PNG et crée des documents PNG contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR

Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Avec Java OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image PNG en document Searchable PDF :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizePage
  • Passez le chemin du fichier PNG en paramètre
  • AsposeOCR.RecognizePage renvoie une chaîne ou un fichier de type Searchable PDF

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou version ultérieure est installé sur votre système.

  • JDK 1.6 ou supérieur est installé.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • PNG Qu'est-ce que PNG Format de fichier

    PNG, Portable Network Graphics, fait référence à un type de format de fichier d'image raster qui utilise une compression sans perte. Ce format de fichier a été créé en remplacement du Graphics Interchange Format (GIF) et n'a aucune limitation de copyright. Cependant, le format de fichier PNG ne prend pas en charge les animations. Le format de fichier PNG prend en charge la compression d'image sans perte, ce qui le rend populaire parmi ses utilisateurs. Au fil du temps, PNG est devenu l'un des formats de fichier image les plus utilisés. Presque tous les systèmes d'exploitation prennent en charge l'ouverture des fichiers PNG. Par exemple, la visionneuse Microsoft Windows a la capacité d'ouvrir les fichiers PNG car le système d'exploitation dispose par défaut de la prise en charge disponible dans le cadre de l'installation.

    Lire la suite

    Searchable PDF Qu'est-ce que Searchable PDF Format de fichier

    Les fichiers PDF interrogeables conservent l'image numérisée d'origine pour l'affichage, ainsi que le texte OCR dans une couche masquée qui peut être utilisée pour les recherches en texte intégral dans un document ou la mise en surbrillance du texte pour les opérations de copier-coller. La conversion complète de l'OCR en PDF, sans inclure l'image d'origine, ne conservera jamais 100 % de la mise en forme d'origine, en particulier si le document contient de nombreuses images ou une mise en page complexe.

    Lire la suite

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)