HTML JPG OCR XML BMP
Aspose.OCR  pour C++
XLSX

Aspose.Imaging pour Java

traite les images numérisées ou même les photos de smartphone au format TIFF et crée des documents TIFF contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR

Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Avec C++ OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image TIFF en document XLSX :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.asposeocr_page()
  • Passez le chemin du fichier TIFF en paramètre
  • AsposeOCR.asposeocr_page renvoie une chaîne ou un fichier de type XLSX

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que Microsoft.ML.OnnxRuntime 1.7.0 ou supérieur est ajouté au projet. Il devrait être installé automatiquement si vous installez Aspose.OCR via NuGet Package Manager.

  • Solution compatible NET Standard 2.0+
  • Aspose.OCR pour .NET référencé dans votre projet.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • TIFF Qu'est-ce que TIFF Format de fichier

    TIFF ou TIF, Tagged Image File Format, représente des images raster destinées à être utilisées sur une variété d'appareils conformes à cette norme de format de fichier. Il est capable de décrire des données d'image à deux niveaux, en niveaux de gris, en couleurs de palette et en couleurs dans plusieurs espaces colorimétriques. Il prend en charge les schémas de compression avec perte et sans perte pour choisir entre l'espace et le temps pour les applications utilisant le format. Le format est extensible et a subi plusieurs révisions qui permettent l'inclusion d'une quantité illimitée d'informations privées ou à usage spécial. Le format ne dépend pas de la machine et est exempt de limites telles que le processeur, le système d'exploitation ou les systèmes de fichiers.

    Lire la suite

    XLSX Qu'est-ce que XLSX Format de fichier

    XLSX est un format bien connu pour les documents Microsoft Excel qui a été introduit par Microsoft avec la sortie de Microsoft Office 2007. Basé sur une structure organisée selon les conventions d'emballage ouvertes comme indiqué dans la partie 2 de la norme OOXML ECMA-376, le nouveau format est un package zip contenant un certain nombre de fichiers XML. La structure sous-jacente et les fichiers peuvent être examinés en décompressant simplement le fichier .xlsx.

    Lire la suite

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)