HTML JPG OCR XML BMP
Aspose.OCR  pour .NET
XML

Convertir JPEG2000 en XML en C#

Effectuez la reconnaissance optique des caractères sur le document JPEG2000 et enregistrez le texte en tant que document JPEG2000 à l’aide d’Aspose.OCR de la bibliothèque .NET.

Comment convertir JPEG2000 en XML en utilisant C#

Aspose.OCR pour .NET est une bibliothèque puissante mais facile à utiliser et rentable pour convertir des images JPEG2000 en documents XML. Prenant en charge 26 langues basées sur le latin, le cyrillique et le chinois, son moteur de reconnaissance optique de caractères à la pointe de la technologie offre une vitesse et une précision de reconnaissance supérieures, tout en vous isolant des formules, des réseaux de neurones et d’autres détails techniques complexes. Il vous permet d’ajouter la fonctionnalité OCR à vos applications .NET en moins de 10 lignes de code.

Aspose.OCR pour .NET

traite les images numérisées ou même les photos de smartphone au format JPEG2000 et crée des documents JPEG2000 contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’installer le Aspose.OCR

NuGet

package dans votre projet avec la commande suivante :

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Étapes pour convertir JPEG2000 en XML

Avec .NET OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image JPEG2000 en document XML :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizeImage
  • Passez le chemin du fichier JPEG2000 en paramètre
  • AsposeOCR.RecognizeImage renvoie une chaîne ou un fichier de type XML

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que l’API .NET compatible avec la spécification NET Standard 2.0 est installée sur votre système et que toutes les [dépendances externes]( https://docs.aspose.com/ocr/net/system-requirements/#external- dépendances) du package Aspose.OCR sont référencés dans votre projet.

  • Solution compatible NET Standard 2.0+
  • Aspose.OCR pour .NET référencé dans votre projet.

Cet exemple de code montre la conversion JPEG2000 à XML .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG2000");
// print text
File. File.WriteAllText("document.XML", riText);
  • JPEG2000 Qu'est-ce que JPEG2000 Format de fichier

    JPEG 2000 (JP2) est un système de codage d'image et une norme de compression d'image de pointe. Conçu en utilisant la technologie des ondelettes JPEG 2000 peut coder du contenu sans perte dans n'importe quelle qualité à la fois. De plus, sans aucune pénalité substantielle dans l'efficacité du codage, JPEG 2000 a la capacité d'accéder et de décoder efficacement le même contenu dans une variété d'autres résolutions et qualités. Les flux de code dans JPEG 2000 sont considérablement évolutifs, ayant des régions d'intérêt qui fournissent la possibilité d'un accès spatial aléatoire. Possédant jusqu'à 16384 composants divers avec des dimensions en térapixels, et une précision pouvant atteindre 38 bits/échantillon.

    Lire la suite

    XML Qu'est-ce que XML Format de fichier

    XML signifie Extensible Markup Language qui est similaire à HTML mais différent dans l'utilisation de balises pour définir des objets. L'idée derrière la création du format de fichier XML était de stocker et de transporter des données sans dépendre d'outils logiciels ou matériels. Sa popularité est due au fait qu'il est à la fois lisible par l'homme et par la machine. Cela lui permet de créer des protocoles de données communs sous la forme d'objets à stocker et à partager sur un réseau tel que le World Wide Web (WWW). Le "X" dans XML est pour extensible, ce qui implique que le langage peut être étendu à n'importe quel nombre de symboles selon les besoins de l'utilisateur. C'est pour ces fonctionnalités que de nombreux formats de fichiers standard l'utilisent, tels que Microsoft Open XML, LibreOffice OpenDocument, XHTML et SVG.

    Lire la suite

    Autres conversions prises en charge

    En utilisant C#, on peut facilement convertir différents formats, y compris.

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)