HTML JPG OCR XML BMP
Aspose.OCR  para {plataforma de idioma}
DOCX

Aspose.Imaging para Java

procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato WBMP y crea documentos WBMP que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita obtener Aspose.OCR

Maven o especifique la configuración del Repositorio Aspose Maven e instálelo dentro de su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml. Para ver ejemplos de Graddle, Ivy, Sbt, consulte nuestro [repositorio] ( https://repository.aspose.com/ocr/ ) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Con C++ OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen WBMP en un documento DOCX:

  • Crear una instancia de la clase AsposeOcr
  • Llamar al método AsposeOCR.asposeocr_page()
  • Pase la ruta del archivo WBMP como parámetro
  • AsposeOCR.asposeocr_page devuelve una cadena o archivo de tipo DOCX

Requisitos del sistema

Antes de ejecutar el ejemplo, asegúrese de que Microsoft.ML.OnnxRuntime 1.7.0 o superior se agregue al proyecto. Debería instalarse automáticamente si instala Aspose.OCR a través de NuGet Package Manager.

  • Solución compatible con NET Standard 2.0+
  • Aspose.OCR para .NET referenciado en su proyecto.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • WBMP Que es WBMP Formato de archivo

    WBMP es un formato de archivo de gráficos monocromáticos optimizado para dispositivos informáticos móviles. Las imágenes WBMP son monocromáticas (blanco y negro), por lo que el tamaño de la imagen se reduce al mínimo. Un píxel negro se denota por 0 y un píxel blanco se denota por 1.

    Lee mas

    DOCX Que es DOCX Formato de archivo

    DOCX es un formato muy conocido para documentos de Microsoft Word. Introducido a partir de 2007 con el lanzamiento de Microsoft Office 2007, la estructura de este nuevo formato de documento se cambió de binario simple a una combinación de XML y archivos binarios. Los archivos Docx se pueden abrir con Word 2007 y versiones laterales, pero no con las versiones anteriores de MS Word que admiten extensiones de archivo DOC.

    Lee mas