HTML JPG OCR XML BMP
Aspose.OCR  pour .NET
DOCX

Convertir DJVU en DOCX en C#

Effectuez la reconnaissance optique des caractères sur le document DJVU et enregistrez le texte en tant que document DJVU à l’aide d’Aspose.OCR de la bibliothèque .NET.

Comment convertir DJVU en DOCX en utilisant C#

Aspose.OCR pour .NET est une bibliothèque puissante mais facile à utiliser et rentable pour convertir des images DJVU en documents DOCX. Prenant en charge 26 langues basées sur le latin, le cyrillique et le chinois, son moteur de reconnaissance optique de caractères à la pointe de la technologie offre une vitesse et une précision de reconnaissance supérieures, tout en vous isolant des formules, des réseaux de neurones et d’autres détails techniques complexes. Il vous permet d’ajouter la fonctionnalité OCR à vos applications .NET en moins de 10 lignes de code.

Aspose.OCR pour .NET

traite les images numérisées ou même les photos de smartphone au format DJVU et crée des documents DJVU contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’installer le Aspose.OCR

NuGet

package dans votre projet avec la commande suivante :

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Étapes pour convertir DJVU en DOCX

Avec .NET OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image DJVU en document DOCX :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizeImage
  • Passez le chemin du fichier DJVU en paramètre
  • AsposeOCR.RecognizeImage renvoie une chaîne ou un fichier de type DOCX

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que l’API .NET compatible avec la spécification NET Standard 2.0 est installée sur votre système et que toutes les [dépendances externes]( https://docs.aspose.com/ocr/net/system-requirements/#external- dépendances) du package Aspose.OCR sont référencés dans votre projet.

  • Solution compatible NET Standard 2.0+
  • Aspose.OCR pour .NET référencé dans votre projet.

Cet exemple de code montre la conversion DJVU à DOCX .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.DJVU");
// print text
File. File.WriteAllText("document.DOCX", riText);
  • DJVU Qu'est-ce que DJVU Format de fichier

    DjVu, prononcé comme "déjà vu", est un format de fichier graphique destiné aux documents numérisés et aux livres, en particulier ceux qui contiennent la combinaison de texte, dessins, images et photographies. Il a été développé par AT&T Labs. Il utilise plusieurs techniques telles que la séparation des couches d'image du texte et des images d'arrière-plan, le chargement progressif, le codage arithmétique et la compression avec perte pour les images bitonales. Étant donné que le fichier DJVU peut contenir des images, des photographies, du texte et des dessins en couleur compressés mais de haute qualité et peut donc être enregistré dans moins d'espace, il est utilisé sur le Web sous forme de livres électroniques, de manuels, de journaux, de documents anciens, etc.

    Lire la suite

    DOCX Qu'est-ce que DOCX Format de fichier

    DOCX est un format bien connu pour les documents Microsoft Word. Introduit à partir de 2007 avec la sortie de Microsoft Office 2007, la structure de ce nouveau format de document est passée de binaire brut à une combinaison de fichiers XML et binaires. Les fichiers Docx peuvent être ouverts avec Word 2007 et les versions latérales, mais pas avec les versions antérieures de MS Word qui prennent en charge les extensions de fichier DOC.

    Lire la suite

    Autres conversions prises en charge

    En utilisant C#, on peut facilement convertir différents formats, y compris.

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)