HTML JPG OCR XML BMP
Aspose.OCR  pour .NET
XLS

Convertir PDF en XLS en C#

Effectuez la reconnaissance optique des caractères sur le document PDF et enregistrez le texte en tant que document PDF à l’aide d’Aspose.OCR de la bibliothèque .NET.

Comment convertir PDF en XLS en utilisant C#

Aspose.OCR pour .NET est une bibliothèque puissante mais facile à utiliser et rentable pour convertir des images PDF en documents XLS. Prenant en charge 26 langues basées sur le latin, le cyrillique et le chinois, son moteur de reconnaissance optique de caractères à la pointe de la technologie offre une vitesse et une précision de reconnaissance supérieures, tout en vous isolant des formules, des réseaux de neurones et d’autres détails techniques complexes. Il vous permet d’ajouter la fonctionnalité OCR à vos applications .NET en moins de 10 lignes de code.

Aspose.OCR pour .NET

traite les images numérisées ou même les photos de smartphone au format PDF et crée des documents PDF contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’installer le Aspose.OCR

NuGet

package dans votre projet avec la commande suivante :

Package Manager Console Command


  PM> Install-Package Aspose.OCR

Étapes pour convertir PDF en XLS

Avec .NET OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image PDF en document XLS :

  • Créer une instance de la classe AsposeOcr
  • Appelez la méthode AsposeOCR.RecognizeImage
  • Passez le chemin du fichier PDF en paramètre
  • AsposeOCR.RecognizeImage renvoie une chaîne ou un fichier de type XLS

Configuration requise

Avant d’exécuter l’exemple, assurez-vous que l’API .NET compatible avec la spécification NET Standard 2.0 est installée sur votre système et que toutes les [dépendances externes]( https://docs.aspose.com/ocr/net/system-requirements/#external- dépendances) du package Aspose.OCR sont référencés dans votre projet.

  • Solution compatible NET Standard 2.0+
  • Aspose.OCR pour .NET référencé dans votre projet.

Cet exemple de code montre la conversion PDF à XLS .NET


// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.PDF");
// print text
File. File.WriteAllText("document.XLS", riText);
  • PDF Qu'est-ce que PDF Format de fichier

    Portable Document Format (PDF) est un type de document créé par Adobe dans les années 1990. Le but de ce format de fichier était d'introduire une norme pour la représentation des documents et autres documents de référence dans un format indépendant du logiciel d'application, du matériel ainsi que du système d'exploitation. Le format de fichier PDF a la pleine capacité de contenir des informations telles que du texte, des images, des hyperliens, des champs de formulaire, des médias enrichis, des signatures numériques, des pièces jointes, des métadonnées, des fonctionnalités géospatiales et des objets 3D qui peuvent faire partie du document source.

    Lire la suite

    XLS Qu'est-ce que XLS Format de fichier

    Les fichiers avec l'extension XLS représentent le format de fichier binaire Excel. Ces fichiers peuvent être créés par Microsoft Excel ainsi que par d'autres tableurs similaires tels que OpenOffice Calc ou Apple Numbers. Le fichier enregistré par Excel est connu sous le nom de classeur où chaque classeur peut avoir une ou plusieurs feuilles de calcul. Les données sont stockées et affichées aux utilisateurs sous forme de tableau dans une feuille de calcul et peuvent couvrir des valeurs numériques, des données textuelles, des formules, des connexions de données externes, des images et des graphiques. Des applications telles que Microsoft Excel vous permettent d'exporter des données de classeur vers plusieurs formats différents, notamment PDF, CSV, XLSX, TXT, HTML, XPS et plusieurs autres. Le format de fichier XLS a été remplacé par un format plus ouvert et structuré, XLSX, avec la sortie de Microsoft Excel 2007. Les dernières versions prennent toujours en charge la création et la lecture de fichiers XLS, bien que XLSX soit désormais le premier choix d'utilisation.

    Lire la suite

    Autres conversions prises en charge

    En utilisant C#, on peut facilement convertir différents formats, y compris.

    TXT (Fichier de document texte)
    Text (Fichier de document texte)
    DOC (Documents générés par Microsoft Word)
    DOCX (Document Microsoft Word)
    XLS (Format de fichier binaire Microsoft Excel)
    XLSX (Documents Microsoft Excel)
    PDF (Format de document portable (PDF))
    Searchable PDF (Graphiques réseau portables consultables)
    XML (Langage de balisage extensible)
    JSON (Notation d'objet JavaScript)