HTML JPG OCR XML BMP
Aspose.OCR  pour C++
Searchable PDF

Aspose.Imaging pour Java

traite les images numérisées ou même les photos de smartphone au format JPEG et crée des documents JPEG contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR

Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Avec C++ OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image JPEG en document Searchable PDF :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.asposeocr_page()
  • Passez le chemin du fichier JPEG en paramètre
  • AsposeOCR.asposeocr_page renvoie une chaîne ou un fichier de type Searchable PDF

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que Microsoft.ML.OnnxRuntime 1.7.0 ou supérieur est ajouté au projet. Il devrait être installé automatiquement si vous installez Aspose.OCR via NuGet Package Manager.

  • Solution compatible NET Standard 2.0+
  • Aspose.OCR pour .NET référencé dans votre projet.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • JPEG Qu'est-ce que JPEG Format de fichier

    Un JPEG est un type de format d'image enregistré à l'aide de la méthode de compression avec perte. L'image de sortie, résultant de la compression, est un compromis entre la taille de stockage et la qualité de l'image. Les utilisateurs peuvent ajuster le niveau de compression pour atteindre le niveau de qualité souhaité tout en réduisant la taille de stockage. La qualité de l'image est négligeable si une compression 10:1 est appliquée à l'image. Plus la valeur de compression est élevée, plus la dégradation de la qualité de l'image est importante.

    Lire la suite

    Searchable PDF Qu'est-ce que Searchable PDF Format de fichier

    Les fichiers PDF interrogeables conservent l'image numérisée d'origine pour l'affichage, ainsi que le texte OCR dans une couche masquée qui peut être utilisée pour les recherches en texte intégral dans un document ou la mise en surbrillance du texte pour les opérations de copier-coller. La conversion complète de l'OCR en PDF, sans inclure l'image d'origine, ne conservera jamais 100 % de la mise en forme d'origine, en particulier si le document contient de nombreuses images ou une mise en page complexe.

    Lire la suite

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)