traite les images numérisées ou même les photos de smartphone au format DJVU et crée des documents DJVU contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’obtenir Aspose.OCR
Maven ou spécifiez la configuration du référentiel Aspose Maven et installez-le dans votre projet basé sur Maven en ajoutant les configurations suivantes au fichier pom.xml. Pour des exemples Graddle, Ivy, Sbt, consultez notre référentiel .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Avec C++ OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image DJVU en document Searchable PDF :
- Créer une instance de la classe AsposeOcr
- Appelez la méthode AsposeOCR.asposeocr_page()
- Passez le chemin du fichier DJVU en paramètre
- AsposeOCR.asposeocr_page renvoie une chaîne ou un fichier de type Searchable PDF
Configuration requise
Avant d’exécuter l’exemple, assurez-vous que Microsoft.ML.OnnxRuntime 1.7.0 ou supérieur est ajouté au projet. Il devrait être installé automatiquement si vous installez Aspose.OCR via NuGet Package Manager.
- Solution compatible NET Standard 2.0+
- Aspose.OCR pour .NET référencé dans votre projet.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
DJVU Qu'est-ce que DJVU Format de fichier
DjVu, prononcé comme "déjà vu", est un format de fichier graphique destiné aux documents numérisés et aux livres, en particulier ceux qui contiennent la combinaison de texte, dessins, images et photographies. Il a été développé par AT&T Labs. Il utilise plusieurs techniques telles que la séparation des couches d'image du texte et des images d'arrière-plan, le chargement progressif, le codage arithmétique et la compression avec perte pour les images bitonales. Étant donné que le fichier DJVU peut contenir des images, des photographies, du texte et des dessins en couleur compressés mais de haute qualité et peut donc être enregistré dans moins d'espace, il est utilisé sur le Web sous forme de livres électroniques, de manuels, de journaux, de documents anciens, etc.
Lire la suiteSearchable PDF Qu'est-ce que Searchable PDF Format de fichier
Les fichiers PDF interrogeables conservent l'image numérisée d'origine pour l'affichage, ainsi que le texte OCR dans une couche masquée qui peut être utilisée pour les recherches en texte intégral dans un document ou la mise en surbrillance du texte pour les opérations de copier-coller. La conversion complète de l'OCR en PDF, sans inclure l'image d'origine, ne conservera jamais 100 % de la mise en forme d'origine, en particulier si le document contient de nombreuses images ou une mise en page complexe.
Lire la suite