Convierte imágenes y archivos PDF a texto en .NET
Agregue reconocimiento óptico de caracteres (OCR) a sus aplicaciones .NET con unas pocas líneas de código.
Download Free TrialAspose.OCR para .NET es una API potente pero fácil de usar y rentable para el reconocimiento óptico de caracteres. Con él, puede agregar la funcionalidad OCR a sus aplicaciones .NET en menos de 5 líneas de código sin preocuparse por matemáticas complejas, redes neuronales y otros detalles técnicos. Nuestra experiencia en tecnologías de aprendizaje automático y años de desarrollo dieron como resultado un motor de OCR con velocidad y precisión superiores que admite 26 idiomas basados en alfabetos latinos y cirílicos , así como en chino . La API de OCR puede reconocer imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla, áreas de imágenes y archivos PDF escaneados y devolver resultados en los formatos de intercambio de datos y documentos más populares. Varios filtros de preprocesamiento le permiten reconocer imágenes giradas, sesgadas y ruidosas. El rendimiento del reconocimiento y la carga del sistema se pueden mejorar aún más mediante la transferencia de tareas computacionales intensivas en recursos a la GPU .
Características y capacidades de Aspose.OCR para .NET
Convierte imágenes y archivos PDF a texto
Admite todos los formatos de imagen que puede obtener de un escáner o una cámara
Lee idiomas basados en el latín y el cirílico.
Reconoce más de 6.000 caracteres chinos
Detecta y reconoce todos los tipos de letra populares
Conserva cuidadosamente los estilos de fuente y el formato.
Procesa toda la imagen o solo las áreas seleccionadas
Admite imágenes giradas, sesgadas y ruidosas
Reconocimiento por lotes de todas las imágenes en una carpeta o archivo
Reconoce las imágenes proporcionadas como enlaces web
Encuentra y corrige automáticamente las palabras mal escritas
Totalmente compatible con otros productos Aspose
Fácil de instalar
Aspose.OCR para .NET se distribuye como un paquete ligero de NuGet o como un archivo descargable con dependencias mínimas. Simplemente instálelo en su proyecto y estará listo para reconocer textos en cualquier idioma admitido y guardar los resultados del reconocimiento en cualquiera de los formatos admitidos.
Solicite una licencia temporal para comenzar a crear una aplicación de OCR totalmente funcional sin límites ni restricciones.
Fácil de usar
Necesita tres líneas de código para reconocer la imagen y mostrar el resultado. ¡Sí, realmente es así de simple!
Imagen a texto en 3 líneas - C#
// Inicializar motor OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Reconocer imagen a texto
string result = recognitionEngine.RecognizeImage("sample.jpg");
// Mostrar el resultado del reconocimiento
Console.WriteLine(result);
multiplataforma
La biblioteca es totalmente compatible con .NET Standard 2.0. Significa que las aplicaciones pueden ejecutarse en cualquier plataforma: Windows de escritorio, Windows Server, macOS, Linux y la nube.
26 idiomas de reconocimiento
La API de OCR puede reconocer una gran cantidad de idiomas y todos los scripts de escritura populares, incluidos los textos con idiomas mixtos.
- Alfabeto latino extendido : croata, checo, danés, holandés, inglés, estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano, eslovaco, esloveno, español, sueco.
- Alfabeto cirílico : bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano.
- Chino : más de 6.000 caracteres.
Puede dejar la detección de idioma a la biblioteca o definir el idioma usted mismo para aumentar el rendimiento y la confiabilidad del reconocimiento.
Reconocer fotos
La mayor barrera para las aplicaciones de OCR es que los escáneres no son comunes para los usuarios finales. La API tiene potentes filtros de preprocesamiento de imágenes incorporados que pueden manejar imágenes giradas, sesgadas y ruidosas. En combinación con la compatibilidad con todos los formatos de imagen, permite un reconocimiento fiable incluso de fotos de teléfonos inteligentes. La mayor parte del preprocesamiento y la corrección de imágenes se realiza automáticamente, por lo que solo tendrás que intervenir en casos difíciles.
Aplicar correcciones de imagen automáticas - C#
// Inicializar motor OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Habilite el cálculo automático de sesgo y el contraste
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true,
AutoSkew = true
};
// Reconocer imagen
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);
convertidor universal
La API puede leer literalmente cualquier imagen que pueda obtener de un escáner, cámara o teléfono inteligente: documentos PDF, imágenes JPEG, PNG, TIFF, GIF, BMP e incluso archivos DjVu. Los documentos PDF de varias páginas, las imágenes TIFF y DjVu son totalmente compatibles. También puede proporcionar una imagen de la web a través de una URL.
Los resultados del reconocimiento se devuelven en los formatos de intercambio de datos y documentos más populares: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.
Reconocer PDF y guardar resultados en JSON - C#
// Inicializar motor OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Reconocer todas las páginas del PDF escaneado
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());
// Salida de cada página como JSON
foreach(var page in pages)
{
Console.WriteLine(page.GetJson());
}
Optimización de recursos
El reconocimiento óptico de caracteres es un proceso que requiere muchos recursos. La API ofrece formas muy flexibles de lograr un equilibrio en la clásica tríada tiempo-precio-calidad:
- Elija entre un reconocimiento completo y un reconocimiento rápido.
- Especifique la cantidad de subprocesos asignados para el reconocimiento o permita que la biblioteca se escale automáticamente a la cantidad de núcleos del procesador.
- Libere la CPU descargando los cálculos a la GPU.
Reconocimiento rápido - C#
// Inicializar motor OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Reconocer imagen en el modo más rápido
string result = recognitionEngine.RecognizeImageFast("sample.jpg");
Corrector ortográfico
Si bien el OCR produce resultados confiables, el polvo y los defectos de impresión pueden hacer que algunos símbolos se reconozcan incorrectamente. La API de OCR tiene un corrector ortográfico incorporado que reemplaza automáticamente las palabras mal escritas y lo libera de tener que corregir manualmente los resultados del reconocimiento.
Resultados de reconocimiento de revisión ortográfica - C#
// Inicializar motor OCR
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Habilitar contraste automático
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true
};
// Reconocer imagen
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);
// Corregir palabras mal escritas
string text = result.GetSpellCheckCorrectedText();
Procesamiento por lotes
La API de OCR lo libera de reconocer cada imagen una por una al ofrecer varios métodos de procesamiento por lotes que le permiten reconocer varias imágenes en una sola llamada:
- Reconocimiento de archivos PDF, TIFF y DjVu de varias páginas.
- Reconocimiento de todos los archivos en una carpeta.
- Reconocimiento de todos los archivos en un archivo.
- Reconocimiento de todos los archivos de una lista.
Aprende con el ejemplo
Aspose.OCR para .NET viene con una serie de ejemplos escritos en C# que le permiten familiarizarse rápidamente con sus funciones y capacidades y le dan una idea de cómo crear soluciones para las necesidades de su negocio.
Support and Learning Resources
- Recursos de aprendizaje
- Documentación
- Código fuente
- Referencias de API
- Vídeos tutoriales
- Soporte de producto
- Soporte gratuito
- Soporte pagado
- Blog
- Notas de lanzamiento
- ¿Por qué Aspose.OCR para .NET?
- Lista de clientes
- Historias de éxito