Convertir JPG en Searchable PDF en C#
Effectuez la reconnaissance optique des caractères sur le document JPG et enregistrez le texte en tant que document JPG à l’aide d’Aspose.OCR de la bibliothèque .NET.
Comment convertir JPG en Searchable PDF en utilisant C#
Aspose.OCR pour .NET est une bibliothèque puissante mais facile à utiliser et rentable pour convertir des images JPG en documents Searchable PDF. Prenant en charge 26 langues basées sur le latin, le cyrillique et le chinois, son moteur de reconnaissance optique de caractères à la pointe de la technologie offre une vitesse et une précision de reconnaissance supérieures, tout en vous isolant des formules, des réseaux de neurones et d’autres détails techniques complexes. Il vous permet d’ajouter la fonctionnalité OCR à vos applications .NET en moins de 10 lignes de code.
traite les images numérisées ou même les photos de smartphone au format JPG et crée des documents JPG contenant du texte reconnu. Pour l’ajouter à votre projet, il vous suffit d’installer le Aspose.OCR
package dans votre projet avec la commande suivante :
Package Manager Console Command
PM> Install-Package Aspose.OCR
Étapes pour convertir JPG en Searchable PDF
Avec .NET OCR et seulement quelques lignes de code, vous pouvez créer une application complète qui convertit une image JPG en document Searchable PDF :
- Créer une instance de la classe AsposeOcr
- Appelez la méthode AsposeOCR.RecognizeImage
- Passez le chemin du fichier JPG en paramètre
- AsposeOCR.RecognizeImage renvoie une chaîne ou un fichier de type Searchable PDF
Configuration requise
Avant d’exécuter l’exemple, assurez-vous que l’API .NET compatible avec la spécification NET Standard 2.0 est installée sur votre système et que toutes les [dépendances externes]( https://docs.aspose.com/ocr/net/system-requirements/#external- dépendances) du package Aspose.OCR sont référencés dans votre projet.
- Solution compatible NET Standard 2.0+
- Aspose.OCR pour .NET référencé dans votre projet.
Cet exemple de code montre la conversion JPG à Searchable PDF .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPG");
// print text
File. File.WriteAllText("document.Searchable PDF", riText);
JPG Qu'est-ce que JPG Format de fichier
Un JPEG est un type de format d'image enregistré à l'aide de la méthode de compression avec perte. L'image de sortie, résultant de la compression, est un compromis entre la taille de stockage et la qualité de l'image. Les utilisateurs peuvent ajuster le niveau de compression pour atteindre le niveau de qualité souhaité tout en réduisant la taille de stockage. La qualité de l'image est négligeable si une compression 10:1 est appliquée à l'image. Plus la valeur de compression est élevée, plus la dégradation de la qualité de l'image est importante.
Lire la suiteSearchable PDF Qu'est-ce que Searchable PDF Format de fichier
Les fichiers PDF interrogeables conservent l'image numérisée d'origine pour l'affichage, ainsi que le texte OCR dans une couche masquée qui peut être utilisée pour les recherches en texte intégral dans un document ou la mise en surbrillance du texte pour les opérations de copier-coller. La conversion complète de l'OCR en PDF, sans inclure l'image d'origine, ne conservera jamais 100 % de la mise en forme d'origine, en particulier si le document contient de nombreuses images ou une mise en page complexe.
Lire la suiteAutres conversions prises en charge
En utilisant C#, on peut facilement convertir différents formats, y compris.