traite les images numérisées ou même les photos de smartphone au format JP2 et crée des documents JP2 contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR
Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Avec C++ OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image JP2 en document DOCX :
- Créer une instance de la classe AsposeOcr
- Appelez la méthode AsposeOCR.asposeocr_page()
- Passez le chemin du fichier JP2 en paramètre
- AsposeOCR.asposeocr_page renvoie une chaîne ou un fichier de type DOCX
Configuration requise
Avant d’exécuter l’exemple, assurez-vous que Microsoft.ML.OnnxRuntime 1.7.0 ou supérieur est ajouté au projet. Il devrait être installé automatiquement si vous installez Aspose.OCR via NuGet Package Manager.
- Solution compatible NET Standard 2.0+
- Aspose.OCR pour .NET référencé dans votre projet.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
JP2 Qu'est-ce que JP2 Format de fichier
JPEG 2000 (JP2) est un système de codage d'image et une norme de compression d'image de pointe. Conçu en utilisant la technologie des ondelettes JPEG 2000 peut coder du contenu sans perte dans n'importe quelle qualité à la fois. De plus, sans aucune pénalité substantielle dans l'efficacité du codage, JPEG 2000 a la capacité d'accéder et de décoder efficacement le même contenu dans une variété d'autres résolutions et qualités. Les flux de code dans JPEG 2000 sont considérablement évolutifs, ayant des régions d'intérêt qui fournissent la possibilité d'un accès spatial aléatoire. Possédant jusqu'à 16384 composants divers avec des dimensions en térapixels, et une précision pouvant atteindre 38 bits/échantillon.
Lire la suiteDOCX Qu'est-ce que DOCX Format de fichier
DOCX est un format bien connu pour les documents Microsoft Word. Introduit à partir de 2007 avec la sortie de Microsoft Office 2007, la structure de ce nouveau format de document est passée de binaire brut à une combinaison de fichiers XML et binaires. Les fichiers Docx peuvent être ouverts avec Word 2007 et les versions latérales, mais pas avec les versions antérieures de MS Word qui prennent en charge les extensions de fichier DOC.
Lire la suite