Aspose.OCR  for C++

Convierte imágenes y archivos PDF a texto en C++

Agregue reconocimiento óptico de caracteres (OCR) a sus aplicaciones C++ con unas pocas líneas de código.

  Download Free Trial
  
 

Aspose.OCR para C++ amplía sus aplicaciones con capacidades de reconocimiento óptico de caracteres en 5 líneas de código. Nuestra experiencia en redes neuronales y aprendizaje automático se ha traducido en una biblioteca de OCR con un rendimiento y una precisión superiores que admite 26 idiomas basados en alfabetos latinos y cirílicos , así como en chino . La API de OCR puede reconocer imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla, áreas de imágenes y archivos PDF escaneados y devolver resultados en los formatos de intercambio de datos y documentos más populares. Está completamente fuera de línea y no requiere una conexión a Internet para funcionar. La API requiere un esfuerzo mínimo para comenzar y una curva de aprendizaje poco profunda para dominarla. Todo el preprocesamiento, la corrección de sesgos, la eliminación de ruido, la detección de idioma, los subprocesos múltiples y otras tareas complejas se realizan automáticamente, pero se pueden ajustar para manejar casos difíciles.

Características avanzadas de la API OCR de C++

Extrae texto de las imágenes y crea archivos PDF con capacidad de búsqueda

Admite cualquier imagen que pueda obtener de un escáner o una cámara

Lee secuencias de comandos latinas y cirílicas extendidas

Reconoce más de 6000 caracteres chinos

Detecta y reconoce todos los tipos de letra y formatos populares

Preprocesa las imágenes antes del reconocimiento

Procesa toda la imagen o solo las áreas seleccionadas

Admite imágenes giradas, sesgadas y ruidosas

Reconocimiento por lotes de todas las imágenes en una carpeta o archivo

Reconoce las imágenes proporcionadas como enlaces web

Encuentra y corrige automáticamente las palabras mal escritas

Obtenga el resultado del reconocimiento como JSON

Fácil de usar

¿Sigues pensando que C++ OCR es difícil? Con nuestra biblioteca, solo necesita 5 líneas de código para reconocer la imagen y mostrar el resultado. Pruebe este código y compruébelo usted mismo:

Imagen a texto en 5 líneas - C++

// Proporcione la ruta de la imagen
std::string image_path = "../Data/Source/sample.png";

// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// haz la magia
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Mostrar el resultado del reconocimiento
std::wcout << buffer << L"\n";

26 idiomas de reconocimiento

La API de OCR puede reconocer una gran cantidad de idiomas y todos los scripts de escritura populares, incluidos los textos con idiomas mixtos.

  • Alfabeto latino extendido : croata, checo, danés, holandés, inglés, estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano, eslovaco, esloveno, español, sueco.
  • Alfabeto cirílico : bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano.
  • Chino : más de 6.000 caracteres.

Puede dejar la detección de idioma a la biblioteca o definir el idioma usted mismo para aumentar el rendimiento y la confiabilidad del reconocimiento.

Procesamiento por lotes

La API de OCR lo libera de reconocer cada imagen una por una al ofrecer varios métodos de procesamiento por lotes que le permiten reconocer varias imágenes en una sola llamada:

  • Reconocimiento de archivos PDF y TIFF de varias páginas.
  • Reconocimiento de todos los archivos en una carpeta.
  • Reconocimiento de todos los archivos en un archivo.

Reconocer archivo ZIP - C++

// Proporcionar ruta de archivo
std::string archive_path = "book.zip";

// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Inicialice el objeto RecognitionSettings con valores predeterminados
RecognitionSettings settings;

// Reconocer
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Conservar formato

La biblioteca de OCR lee todos los tipos de letra populares como Arial, Times New Roman, Courier New, Tahoma, Calibri y más en estilos regulares, negrita y cursiva y conserva cuidadosamente el formato en los resultados de OCR. También puede dividir los resultados del reconocimiento en líneas y detectar áreas de texto en una página.

Reconocer fotos

La adopción generalizada de aplicaciones de OCR generalmente se detiene por el hecho de que los escáneres no son comunes para la mayoría de los usuarios. Nuestra biblioteca de OCR tiene potentes filtros de preprocesamiento de imágenes incorporados que pueden manejar imágenes oscuras, giradas, sesgadas y ruidosas. En combinación con la compatibilidad con todos los formatos de imagen, permite un reconocimiento fiable incluso de fotos de teléfonos inteligentes. La mayor parte del preprocesamiento y la corrección de imágenes se realiza automáticamente, por lo que solo tendrás que intervenir en casos difíciles.

Establecer ángulo personalizado para la corrección de sesgo - C++

// Imagen original
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Ajustar el ángulo de inclinación
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Reconocer imagen
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Corrector ortográfico

Si bien el OCR produce resultados confiables, el polvo y los defectos de impresión pueden hacer que algunos símbolos se reconozcan incorrectamente. La API de OCR tiene un corrector ortográfico incorporado que reemplaza automáticamente las palabras mal escritas y lo libera de tener que corregir manualmente los resultados del reconocimiento.

  

Support and Learning Resources

  
  

Aspose también ofrece API nativas de OCR para otros lenguajes de programación populares: