API de OCR nativa para aplicaciones .NET
Convertir imagen a texto en C#
Más vitrinas >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
¿Por qué Aspose.OCR for .NET?
Aspose.OCR for .NET es una API sólida, rentable y fácil de usar para el reconocimiento óptico de caracteres. En menos de 10 líneas de código C# nativo, puede crear capacidades de OCR en sus soluciones de escritorio .NET, aplicaciones web basadas en MVC, servicios en la nube y funciones de Azure sin servidor. Extraiga texto legible por máquina a partir de escaneos, fotografías y capturas de pantalla, convierta páginas escaneadas en archivos PDF indexables y con capacidad de búsqueda, busque y compare texto en imágenes centrándose en tareas comerciales en lugar de matemáticas complejas, redes neuronales y otras complejidades técnicas. Haga clic en los elementos a continuación para obtener más información sobre nuestras características y beneficios.
Aplicaciones globales
Reconocer textos en caracteres latinos, cirílicos y asiáticos, incluidos más de 6.000 caracteres chinos e hindi.
leer todo
Recupere texto de cualquier archivo obtenido a través de un escáner o cámara y procese imágenes directamente desde enlaces web.
Resultados confiables
Logre una alta precisión de reconocimiento para todas las imágenes, incluidas aquellas que están desenfocadas, giradas, distorsionadas y con ruido.
reconocimiento por lotes
Reconocer de forma masiva todas las imágenes de carpetas y archivos; lea documentos PDF de varias páginas e imágenes TIFF.
Detección de diseño
Identifique y categorice bloques de contenido en imágenes para garantizar el orden correcto del texto extraído, independientemente del diseño.
Ejemplo de código en vivo
El reconocimiento óptico de caracteres se convierte en una tarea trivial y sencilla con Aspose.OCR, incluso para los desarrolladores nuevos en la tecnología. Sólo unas pocas líneas de código son suficientes para extraer texto de una imagen y mostrarlo en la pantalla. Realmente es así de simple: pruébalo.
* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.
Convertir imagen a texto
Más ejemplos >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Independencia de plataforma
Aspose.OCR for .NET puede funcionar en cualquier plataforma que admita .NET, .NET Core o .NET Framework, ya sea en un local máquina, en el servidor web o en la nube.
Formatos de archivo admitidos
Aspose.OCR for .NET puede trabajar con prácticamente cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se devuelven en los formatos de intercambio de datos y archivos más populares que se pueden guardar, importar a una base de datos o analizar en tiempo real.
Imágenes
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR por lotes
- Multi-page PDF
- DjVu
- ZIP
- Folder
Resultados del reconocimiento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Apto para cualquier contenido.
La precisión y confiabilidad del reconocimiento de texto depende en gran medida de la calidad de la imagen original. Aspose.OCR for .NET proporciona una amplia gama de filtros de procesamiento de imágenes manuales y totalmente automatizados que mejoran una imagen antes de enviarla al motor de OCR.
El potente procesamiento de imágenes y los algoritmos de detección de estructura de contenido personalizables permiten la extracción de texto de prácticamente cualquier imagen, desde escaneos de alta calidad hasta fotografías de calles. Se pueden aplicar varios filtros de procesamiento a la misma imagen para obtener la mejor calidad de reconocimiento.
Optimización de recursos
Aspose.OCR for .NET permite un equilibrio altamente flexible entre la velocidad de reconocimiento, la calidad y la utilización de recursos para cada caso de uso específico:
- Elija entre reconocimiento exhaustivo y reconocimiento rápido.
- Especifique la cantidad de subprocesos asignados para el reconocimiento o permita que la biblioteca escale automáticamente a la cantidad de núcleos de procesador.
- Libere la CPU descargando los cálculos a la GPU.
Más de 130 idiomas de reconocimiento
Aspose.OCR for .NET es una solución universal para el procesamiento de documentos, extracción de datos y digitalización de contenidos a escala global. Al admitir una amplia gama de guiones escritos en Europa, Medio Oriente y Asia, está bien adaptado a cualquier escala y atiende tanto a pequeñas y medianas empresas como a corporaciones multinacionales.
Puede delegar la detección de idioma a la biblioteca o especificar manualmente el idioma, mejorando el rendimiento y la confiabilidad del reconocimiento. Se admiten los siguientes idiomas:
- Alfabeto latino extendido: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 años;
- Alfabeto cirílico: ruso, ucraniano, kazajo, serbio, bielorruso, búlgaro;
- árabe, persa, urdu;
- Escritura china y devanagari, incluidos hindi, marathi, bhojpuri y otros.
Características y capacidades
Aspose.OCR for .NET extrae automáticamente texto de fotografías o imágenes escaneadas, eliminando la necesidad de volver a escribir manualmente los documentos.
OCR de fotos
Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.
PDF con capacidad de búsqueda
Convierta cualquier escaneo en un documento indexable y con capacidad de búsqueda completa.
reconocimiento de URL
Reconocer una imagen desde la URL sin descargarla localmente.
Reconocimiento masivo
Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.
Cualquier fuente y estilo
Identifique y reconozca texto en todos los tipos de letra y estilos populares.
Reconocimiento preciso
Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.
Corrector ortográfico
Mejore los resultados corrigiendo automáticamente las palabras mal escritas.
Buscar texto en imágenes
Busque texto o expresión regular dentro de un conjunto de imágenes.
Comparar textos de imágenes
Compare textos en dos imágenes, independientemente del caso y el diseño.
Fácil de usar
Solo necesita unas pocas líneas de código para convertir imágenes en texto, crear un PDF con capacidad de búsqueda, guardar los resultados del reconocimiento en un documento y mucho más. Explore los ejemplos de código para comprender cómo integrar Aspose.OCR for .NET en sus soluciones.
Instalación
Puede comenzar a usar Aspose.OCR for .NET inmediatamente después de la instalación con algunas restricciones . Una licencia temporal elimina todas las limitaciones de la versión de prueba durante 30 días. Úselo para comenzar a crear una aplicación de OCR completamente funcional y tomar la decisión final de comprar Aspose.OCR for .NET más adelante.
Extraer texto de una foto
Cuando la gente suele pensar en OCR (reconocimiento óptico de caracteres), la primera asociación suele ser con un escáner como dispositivo de captura principal. Esta asociación tiene razones históricas y todavía prevalece en muchos contextos, proporcionando un entorno consistente y controlado para capturar texto impreso a partir de documentos físicos con una calidad inigualable. Sin embargo, un escáner es un equipo especializado que no siempre está a mano y requiere una estación de trabajo estacionaria para funcionar. Afortunadamente, el mundo moderno ofrece una alternativa conveniente a los escáneres tradicionales: la cámara de un teléfono inteligente. Los avances en la tecnología de las cámaras de los teléfonos inteligentes garantizan que incluso un teléfono inteligente básico proporcione calidad suficiente para capturar documentos listos para OCR. Y la memoria integrada hace que sea más fácil que nunca digitalizar grandes cantidades de documentos, periódicos, libros, señales de tráfico y otros textos sobre la marcha. Todo lo que necesitas es la tecnología adecuada para convertir esas fotos en texto legible por máquina.
Aspose.OCR for .NET está diseñado específicamente para reconocer todo tipo de imágenes listas para usar y puede ajustarse aún más para manejar incluso las fotos de baja calidad. Combinado con un teléfono inteligente moderno, le permite crear potentes aplicaciones de OCR para la mayoría de las tareas diarias de escaneo y reconocimiento de texto. El procesamiento de imágenes y el análisis de la estructura de documentos más avanzados se realizan en unas pocas líneas de código, lo que le permite centrarse en el negocio en lugar de en complejos algoritmos matemáticos, redes neuronales y otras complejidades técnicas.
OCR de fotos - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Cree un PDF con capacidad de búsqueda a partir del escaneo
PDF es uno de los formatos más populares para escanear documentos en papel, especialmente debido a su capacidad para combinar varias páginas en un solo archivo. Este formato se utiliza ampliamente para el intercambio de contratos, facturas, documentos legales, pasaportes y documentos de identidad, y muchos otros documentos entre particulares, empresas, bancos y agencias gubernamentales. Sin embargo, cualquier PDF escaneado es esencialmente una colección de imágenes. No contiene texto legible por máquina, por lo que los usuarios no pueden buscar, copiar ni manipular de otro modo el contenido del documento.
Aspose.OCR for .NET le ofrece una manera rápida, fácil y altamente confiable de convertir cualquier PDF escaneado en un documento indexable y con capacidad de búsqueda completa. Reconoce con precisión el contenido de la página y lo convierte en una capa de texto legible por máquina sobre la imagen original que puede seleccionarse, copiarse, leerse mediante software de conversión de texto a voz e incluso procesarse automáticamente mediante traductores, resumidores y otros análisis basados en IA. herramientas.
Agregar superposición de texto a PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Buscar texto en imágenes
Los archivos digitales, especialmente en organizaciones grandes, a menudo constan de una vasta colección de escaneos y fotografías, muchas de las cuales pueden contener documentos de varias páginas. La gestión y organización eficiente de dichos archivos es esencial para facilitar la recuperación y navegación de la información. Sin embargo, las imágenes no contienen texto legible por máquina, lo que hace imposible buscar y analizar el contenido del documento.
Aspose.OCR for .NET le permite buscar fácilmente texto en imágenes, independientemente de la fuente, el tamaño del texto, el estilo y otros parámetros. La biblioteca también admite búsquedas que no distinguen entre mayúsculas y minúsculas y expresiones regulares, que resultan extremadamente útiles en diversas aplicaciones e industrias. Esta funcionalidad se puede utilizar para categorizar documentos según el contenido, las palabras clave o los patrones que se encuentran en el texto; buscar términos o cláusulas específicas dentro de acuerdos y contratos; reorganizar archivos en función de palabras clave o contenido que se encuentran en ellos; Localice e identifique datos personales dentro de los documentos, lo que facilita garantizar el cumplimiento del RGPD y gestionar la información confidencial de forma más eficaz. La búsqueda dentro de las imágenes también permite crear flujos de trabajo automatizados y optimizar diversos procesos comerciales al recibir contratos y facturas firmados.
Buscar texto en imágenes - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}