HTML JPG OCR XML BMP
Aspose.OCR  para {plataforma de idioma}
DOC

Aspose.Imaging para Java

procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato WBMP y crea documentos WBMP que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita obtener Aspose.OCR

Maven o especifique la configuración del Repositorio Aspose Maven e instálelo dentro de su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml. Para ver ejemplos de Graddle, Ivy, Sbt, consulte nuestro [repositorio] ( https://repository.aspose.com/ocr/ ) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Con C++ OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen WBMP en un documento DOC:

  • Crear una instancia de la clase AsposeOcr
  • Llamar al método AsposeOCR.asposeocr_page()
  • Pase la ruta del archivo WBMP como parámetro
  • AsposeOCR.asposeocr_page devuelve una cadena o archivo de tipo DOC

Requisitos del sistema

Antes de ejecutar el ejemplo, asegúrese de que Microsoft.ML.OnnxRuntime 1.7.0 o superior se agregue al proyecto. Debería instalarse automáticamente si instala Aspose.OCR a través de NuGet Package Manager.

  • Solución compatible con NET Standard 2.0+
  • Aspose.OCR para .NET referenciado en su proyecto.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • WBMP Que es WBMP Formato de archivo

    WBMP es un formato de archivo de gráficos monocromáticos optimizado para dispositivos informáticos móviles. Las imágenes WBMP son monocromáticas (blanco y negro), por lo que el tamaño de la imagen se reduce al mínimo. Un píxel negro se denota por 0 y un píxel blanco se denota por 1.

    Lee mas

    DOC Que es DOC Formato de archivo

    Los archivos con extensión .doc representan documentos generados por Microsoft Word u otros documentos de procesamiento de texto en formato de archivo binario. La extensión se usó inicialmente para la documentación de texto sin formato en varios sistemas operativos diferentes. Puede contener varios tipos diferentes de datos, como imágenes, texto formateado y sin formato, gráficos, tablas, objetos incrustados, enlaces, páginas, formato de página, configuraciones de impresión y muchos otros. El formato fue popular para todo tipo de documentación debido a la variedad de opciones que ofrece a los usuarios para escribir manuales, propuestas, especificaciones, currículos, artículos o cualquier documento similar. La versión actualizada de DOC es DOCX, que se basa en Office OpenXML cuyas especificaciones están disponibles abiertamente.

    Lee mas