Convierte imágenes y archivos PDF a texto en C++
Agregue reconocimiento óptico de caracteres (OCR) a sus aplicaciones C++ con unas pocas líneas de código.
Download Free TrialAspose.OCR para C++ amplía sus aplicaciones con capacidades de reconocimiento óptico de caracteres en 5 líneas de código. Nuestra experiencia en redes neuronales y aprendizaje automático se ha traducido en una biblioteca de OCR con un rendimiento y una precisión superiores que admite 26 idiomas basados en alfabetos latinos y cirílicos , así como en chino . La API de OCR puede reconocer imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla, áreas de imágenes y archivos PDF escaneados y devolver resultados en los formatos de intercambio de datos y documentos más populares. Está completamente fuera de línea y no requiere una conexión a Internet para funcionar. La API requiere un esfuerzo mínimo para comenzar y una curva de aprendizaje poco profunda para dominarla. Todo el preprocesamiento, la corrección de sesgos, la eliminación de ruido, la detección de idioma, los subprocesos múltiples y otras tareas complejas se realizan automáticamente, pero se pueden ajustar para manejar casos difíciles.
Características avanzadas de la API OCR de C++
Extrae texto de las imágenes y crea archivos PDF con capacidad de búsqueda
Admite cualquier imagen que pueda obtener de un escáner o una cámara
Lee secuencias de comandos latinas y cirílicas extendidas
Reconoce más de 6000 caracteres chinos
Detecta y reconoce todos los tipos de letra y formatos populares
Preprocesa las imágenes antes del reconocimiento
Procesa toda la imagen o solo las áreas seleccionadas
Admite imágenes giradas, sesgadas y ruidosas
Reconocimiento por lotes de todas las imágenes en una carpeta o archivo
Reconoce las imágenes proporcionadas como enlaces web
Encuentra y corrige automáticamente las palabras mal escritas
Obtenga el resultado del reconocimiento como JSON
Fácil de usar
¿Sigues pensando que C++ OCR es difícil? Con nuestra biblioteca, solo necesita 5 líneas de código para reconocer la imagen y mostrar el resultado. Pruebe este código y compruébelo usted mismo:
Imagen a texto en 5 líneas - C++
// Proporcione la ruta de la imagen
std::string image_path = "../Data/Source/sample.png";
// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// haz la magia
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);
// Mostrar el resultado del reconocimiento
std::wcout << buffer << L"\n";
26 idiomas de reconocimiento
La API de OCR puede reconocer una gran cantidad de idiomas y todos los scripts de escritura populares, incluidos los textos con idiomas mixtos.
- Alfabeto latino extendido : croata, checo, danés, holandés, inglés, estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano, eslovaco, esloveno, español, sueco.
- Alfabeto cirílico : bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano.
- Chino : más de 6.000 caracteres.
Puede dejar la detección de idioma a la biblioteca o definir el idioma usted mismo para aumentar el rendimiento y la confiabilidad del reconocimiento.
Procesamiento por lotes
La API de OCR lo libera de reconocer cada imagen una por una al ofrecer varios métodos de procesamiento por lotes que le permiten reconocer varias imágenes en una sola llamada:
- Reconocimiento de archivos PDF y TIFF de varias páginas.
- Reconocimiento de todos los archivos en una carpeta.
- Reconocimiento de todos los archivos en un archivo.
Reconocer archivo ZIP - C++
// Proporcionar ruta de archivo
std::string archive_path = "book.zip";
// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Inicialice el objeto RecognitionSettings con valores predeterminados
RecognitionSettings settings;
// Reconocer
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);
Conservar formato
La biblioteca de OCR lee todos los tipos de letra populares como Arial, Times New Roman, Courier New, Tahoma, Calibri y más en estilos regulares, negrita y cursiva y conserva cuidadosamente el formato en los resultados de OCR. También puede dividir los resultados del reconocimiento en líneas y detectar áreas de texto en una página.
Reconocer fotos
La adopción generalizada de aplicaciones de OCR generalmente se detiene por el hecho de que los escáneres no son comunes para la mayoría de los usuarios. Nuestra biblioteca de OCR tiene potentes filtros de preprocesamiento de imágenes incorporados que pueden manejar imágenes oscuras, giradas, sesgadas y ruidosas. En combinación con la compatibilidad con todos los formatos de imagen, permite un reconocimiento fiable incluso de fotos de teléfonos inteligentes. La mayor parte del preprocesamiento y la corrección de imágenes se realiza automáticamente, por lo que solo tendrás que intervenir en casos difíciles.
Establecer ángulo personalizado para la corrección de sesgo - C++
// Imagen original
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };
// Preparar buffer para resultado
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Ajustar el ángulo de inclinación
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;
// Reconocer imagen
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
Corrector ortográfico
Si bien el OCR produce resultados confiables, el polvo y los defectos de impresión pueden hacer que algunos símbolos se reconozcan incorrectamente. La API de OCR tiene un corrector ortográfico incorporado que reemplaza automáticamente las palabras mal escritas y lo libera de tener que corregir manualmente los resultados del reconocimiento.
Support and Learning Resources
- Recursos de aprendizaje
- Documentación
- Código fuente
- Referencias de API
- Vídeos tutoriales
- Soporte de producto
- Soporte gratuito
- Soporte pagado
- Blog
- Notas de lanzamiento
- ¿Por qué Aspose.OCR para C++?
- Lista de clientes
- Historias de éxito