Convertir {Formato1} a {Formato2} en C#
Realice el reconocimiento óptico de caracteres en el documento JPEG y guarde el texto como documento JPEG usando Aspose.OCR de la biblioteca .NET.
Cómo convertir JPEG a DOCX usando C#
Aspose.OCR para .NET es una biblioteca potente pero fácil de usar y rentable para convertir imágenes JPEG a documentos DOCX. Compatible con 26 idiomas basados en el latín, el cirílico y el chino, su motor de reconocimiento óptico de caracteres de última generación proporciona una velocidad y precisión de reconocimiento superiores, a la vez que lo aísla de fórmulas, redes neuronales y otros detalles técnicos complejos. Le permite agregar la funcionalidad OCR a sus aplicaciones .NET en menos de 10 líneas de código.
procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato JPEG y crea documentos JPEG que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita instalar Aspose.OCR
paquete en su proyecto con el siguiente comando:
Package Manager Console Command
PM> Install-Package Aspose.OCR
Pasos para convertir {Formato1} a {Formato2}
Con .NET OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen JPEG en un documento DOCX:
- Crear una instancia de la clase AsposeOcr
- Llamar al método AsposeOCR.RecognizeImage
- Pase la ruta del archivo JPEG como parámetro
- AsposeOCR.RecognizeImage devuelve una cadena o archivo de tipo DOCX
Requisitos del sistema
Antes de ejecutar el ejemplo, asegúrese de que la API .NET compatible con la especificación NET Standard 2.0 esté instalada en su sistema y todas las [dependencias externas] ( https://docs.aspose.com/ocr/net/system-requirements/#external- dependencias) del paquete Aspose.OCR se hace referencia en su proyecto.
- Solución compatible con NET Standard 2.0+
- Aspose.OCR para .NET referenciado en su proyecto.
Este código de ejemplo muestra la conversión de JPEG a DOCX .NET
// initialize an instance of AsposeOcr
AsposeOcr ocr = new AsposeOcr();
// recognize image
string riText = ocr.RecognizeImage("template.JPEG");
// print text
File. File.WriteAllText("document.DOCX", riText);
JPEG Que es JPEG Formato de archivo
Un JPEG es un tipo de formato de imagen que se guarda mediante el método de compresión con pérdida. La imagen de salida, como resultado de la compresión, es un equilibrio entre el tamaño de almacenamiento y la calidad de la imagen. Los usuarios pueden ajustar el nivel de compresión para lograr el nivel de calidad deseado y, al mismo tiempo, reducir el tamaño de almacenamiento. La calidad de la imagen se ve afectada de manera insignificante si se aplica una compresión de 10:1 a la imagen. Cuanto mayor sea el valor de compresión, mayor será la degradación de la calidad de la imagen.
Lee masDOCX Que es DOCX Formato de archivo
DOCX es un formato muy conocido para documentos de Microsoft Word. Introducido a partir de 2007 con el lanzamiento de Microsoft Office 2007, la estructura de este nuevo formato de documento se cambió de binario simple a una combinación de XML y archivos binarios. Los archivos Docx se pueden abrir con Word 2007 y versiones laterales, pero no con las versiones anteriores de MS Word que admiten extensiones de archivo DOC.
Lee masOtras conversiones admitidas
Usando C#, uno puede convertir fácilmente diferentes formatos, incluidos.