procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato TIF y crea documentos TIF que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita obtener Aspose.OCR
Maven o especifique la configuración del Repositorio Aspose Maven e instálelo dentro de su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml. Para ver ejemplos de Graddle, Ivy, Sbt, consulte nuestro [repositorio] ( https://repository.aspose.com/ocr/ ) .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Con C++ OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen TIF en un documento DOCX:
- Crear una instancia de la clase AsposeOcr
- Llamar al método AsposeOCR.asposeocr_page()
- Pase la ruta del archivo TIF como parámetro
- AsposeOCR.asposeocr_page devuelve una cadena o archivo de tipo DOCX
Requisitos del sistema
Antes de ejecutar el ejemplo, asegúrese de que Microsoft.ML.OnnxRuntime 1.7.0 o superior se agregue al proyecto. Debería instalarse automáticamente si instala Aspose.OCR a través de NuGet Package Manager.
- Solución compatible con NET Standard 2.0+
- Aspose.OCR para .NET referenciado en su proyecto.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
TIF Que es TIF Formato de archivo
TIFF o TIF, formato de archivo de imagen etiquetada, representa imágenes de trama diseñadas para su uso en una variedad de dispositivos que cumplen con este estándar de formato de archivo. Es capaz de describir datos de imágenes de dos niveles, escala de grises, colores de paleta y a todo color en varios espacios de color. Admite esquemas de compresión con pérdida y sin pérdida para elegir entre el espacio y el tiempo para las aplicaciones que utilizan el formato. El formato es extensible y ha sufrido varias revisiones que permiten la inclusión de una cantidad ilimitada de información privada o de propósito especial. El formato no depende de la máquina y está libre de límites como el procesador, el sistema operativo o los sistemas de archivos.
Lee masDOCX Que es DOCX Formato de archivo
DOCX es un formato muy conocido para documentos de Microsoft Word. Introducido a partir de 2007 con el lanzamiento de Microsoft Office 2007, la estructura de este nuevo formato de documento se cambió de binario simple a una combinación de XML y archivos binarios. Los archivos Docx se pueden abrir con Word 2007 y versiones laterales, pero no con las versiones anteriores de MS Word que admiten extensiones de archivo DOC.
Lee mas