procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato JP2 y crea documentos JP2 que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita obtener Aspose.OCR
Maven o especifique la configuración del Repositorio Aspose Maven e instálelo dentro de su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml. Para ver ejemplos de Graddle, Ivy, Sbt, consulte nuestro [repositorio] ( https://repository.aspose.com/ocr/ ) .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Con C++ OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen JP2 en un documento DOC:
- Crear una instancia de la clase AsposeOcr
- Llamar al método AsposeOCR.asposeocr_page()
- Pase la ruta del archivo JP2 como parámetro
- AsposeOCR.asposeocr_page devuelve una cadena o archivo de tipo DOC
Requisitos del sistema
Antes de ejecutar el ejemplo, asegúrese de que Microsoft.ML.OnnxRuntime 1.7.0 o superior se agregue al proyecto. Debería instalarse automáticamente si instala Aspose.OCR a través de NuGet Package Manager.
- Solución compatible con NET Standard 2.0+
- Aspose.OCR para .NET referenciado en su proyecto.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
JP2 Que es JP2 Formato de archivo
JPEG 2000 (JP2) es un sistema de codificación de imágenes y un estándar de compresión de imágenes de última generación. Diseñado, utilizando la tecnología wavelet, JPEG 2000 puede codificar contenido sin pérdidas en cualquier calidad a la vez. Además, sin ninguna penalización sustancial en la eficiencia de la codificación, JPEG 2000 tiene la capacidad de acceder y decodificar el mismo contenido de manera eficaz en una variedad de otras resoluciones y calidades. Los flujos de código en JPEG 2000 son significativamente escalables y tienen regiones de interés que brindan la posibilidad de acceso espacial aleatorio. Posee hasta 16384 componentes diversos con las dimensiones en terapixels y una precisión que puede llegar a 38 bits/muestra.
Lee masDOC Que es DOC Formato de archivo
Los archivos con extensión .doc representan documentos generados por Microsoft Word u otros documentos de procesamiento de texto en formato de archivo binario. La extensión se usó inicialmente para la documentación de texto sin formato en varios sistemas operativos diferentes. Puede contener varios tipos diferentes de datos, como imágenes, texto formateado y sin formato, gráficos, tablas, objetos incrustados, enlaces, páginas, formato de página, configuraciones de impresión y muchos otros. El formato fue popular para todo tipo de documentación debido a la variedad de opciones que ofrece a los usuarios para escribir manuales, propuestas, especificaciones, currículos, artículos o cualquier documento similar. La versión actualizada de DOC es DOCX, que se basa en Office OpenXML cuyas especificaciones están disponibles abiertamente.
Lee mas