OCR for C++

OCR for Python via .NET

OCR for Python via Java

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for .NET

Biblioteca C# OCR alimentada con IA para aplicaciones .NET

Biblioteca .NET OCR que admite más de 140 lenguajes de reconocimiento que extraen texto de imágenes y crea PDF de búsqueda con solo unas pocas líneas de código C#.

Descargar Ensayo Compra

Mira lo nuevo

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
     = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

> dotnet add package Aspose.OCR

¿Por qué elegir la biblioteca Aspose OCR?

Cree potentes capacidades de OCR en sus aplicaciones .NET en segundos. Nuestra API OCR fácil de usar le permite extraer texto de imágenes y escaneos, crear PDF de búsqueda y más con un código C# mínimo. Ideal para funciones de escritorio, web, nube y sin servidor .NET.
Experimente OCR que no solo extrae texto, sino que lo comprende y mejora con AI. Haga clic en los elementos a continuación para obtener más información sobre nuestras características y beneficios.

Aplicaciones globales de OCR

C# OCR reconoce los textos de inglés, cirílico, árabe, persa, chino, japonés, coreano, hindi, tamil y en lenguaje mixto.

Leer todo

Obtenga texto de cualquier archivo obtenido a través de un escáner o cámara, y procese imágenes directamente desde los enlaces web.

Resultados confiables

Lograr una alta precisión de reconocimiento para todas las imágenes, incluidas las que están fuera de enfoque, rotadas, distorsionadas y ruidosas.

Reconocimiento por lotes

Reconocer todas las imágenes de carpetas y archivos; Lea los documentos PDF de varias páginas e imágenes TIFF.

Detección de diseño

Identifique y clasifique los bloques de contenido en las imágenes para garantizar el orden correcto del texto extraído, independientemente del diseño.

AI Postprocesamiento usando LLMS

No solo OCR: su solución de IA todo en uno para el reconocimiento de texto más inteligente y sin errores. Aspose.OCR Now integra IA y LLM para elegir modelos que mejoren significativamente la precisión de OCR: fijar los errores, restaurar el texto faltante y mejorar la calidad general de reconocimiento.

Muestra de código en vivo

.NET OCR se convierte en una tarea trivial y directa con la API de OCR de Aspose, incluso para los nuevos desarrolladores. Solo unas pocas líneas de código son suficientes para extraer texto de una imagen y mostrarlo en la pantalla. Realmente es así de simple, pruébalo.

Listo para reconocer Listo para reconocer Deje caer un archivo aquí o haga clic para navegar *

* Al cargar sus archivos o utilizando el servicio que acepta con nuestro Condiciones de uso y política de privacidad.

Resultado de reconocimiento

// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Independencia de la plataforma

La biblioteca OCR de plataforma cruzada puede funcionar en todas partes en .NET, .NET Core o .NET Framework, ya sea en una máquina local, en el servidor web o en la nube.

Formatos de archivo compatibles

Aspose.OCR for .NET puede funcionar con cualquier archivo Puede obtener de un escáner o cámara. Los resultados de reconocimiento se pueden guardar, importar a una base de datos o analizarse en tiempo real.

Imágenes

JPEG
PNG
TIFF
BMP
GIF

OCR por lotes

Multi-page PDF
DjVu
ZIP
Folder

Resultados de reconocimiento

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

OCR con alimentación de LLM: la próxima generación de OCR impulsada por modelos de idiomas AI.

La precisión de los resultados no se detiene en el reconocimiento: desbloquee el siguiente nivel de calidad refinando texto usando LLM externos.

Corrija automáticamente la ortografía y la gramática en el texto reconocido.
Normalice las inconsistencias y los problemas de formato en escaneos de varias páginas.
Adapte los resultados de reconocimiento al vocabulario específico del sujeto utilizando modelos de inmediato.
Integre cualquier tubería LLM externa en su flujo de trabajo OCR con solo unas pocas líneas de código.

Adecuado para cualquier contenido

La precisión y confiabilidad del reconocimiento de texto en C# dependen en gran medida de la calidad de la imagen. .NET OCR ofrece un conjunto completo de optimización de imágenes automatizada y manual, asegurando resultados de reconocimiento superiores.

Procesamiento de imágenes potente, detección de texto totalmente personalizable, postprocesamiento y corrección de ortografía automatizada permiten la extracción de texto de cualquier escaneo o foto con mayor precisión.

Optimización de recursos de OCR

La biblioteca Aspose ‘C# OCR permite un equilibrio altamente flexible de la velocidad de reconocimiento, la calidad y la utilización de recursos para cada caso de uso específico:

Elija entre reconocimiento exhaustivo y reconocimiento rápido.
Especifique el número de subprocesos asignados para el reconocimiento, o permita que nuestra biblioteca .NET OCR escala automáticamente al número de núcleos de procesador.
Libere la CPU descargando los cálculos a la GPU.

140+ lenguajes de reconocimiento

Nuestra biblioteca C# OCR es una solución universal para el procesamiento de documentos, la extracción de datos y la digitalización de contenido a escala global. Con el apoyo a una amplia gama de guiones de escritura europeos, del Medio Oriente y Asia, está bien adaptado para cualquier país y negocio.

Puede reconocer documentos escritos en idiomas mixtos, como chino/inglés, árabe/francés o cirílico/inglés. Se admiten los siguientes idiomas:

** Latín extendido **: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 más;
** Cirílico ** Alfabeto: ruso, ucraniano, kazajro, búlgaro, incluidos textos de cirílicos/ingleses mixtos;
Árabe, persa, urdu, incluidos textos mezclados con inglés;
Idiomas chinos, coreanos, japoneses, devanagari y dravidianos, incluidos hindi, tamil, marathi y otros.

Características y capacidades

C# OCR extrae automáticamente el texto de fotos o escaneos, eliminando la necesidad de la reducción manual de documentos.

Foto OCR

Extraiga el texto de las fotos del teléfono inteligente con precisión de nivel de escaneo.

PDF de búsqueda

Convierta cualquier escaneo en un documento totalmente de búsqueda e indexable.

Reconocimiento de URL

Reconocer una imagen de URL sin descargarla localmente.

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Cualquier fuente y estilo

Identificar y reconocer el texto en todos los tipos de letra y estilos populares.

Reconocimiento de afinidad

Ajuste cada parámetro OCR para obtener mejores resultados de reconocimiento.

Corrector ortográfico

Mejorar los resultados corrigiendo automáticamente las palabras mal escritas.

Encuentra texto en las imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Comparar textos de imagen

Compare textos en dos imágenes, independientemente del caso y el diseño.

Corrección con IA

Arregle las palabras y la gramática mal reconocidas utilizando LLM basados en transformadores, no se requiere capacitación personalizada.

Posprocesamiento semántico

Vaya más allá de los caracteres: refine la salida de OCR ruidoso con LLM para mejorar la calidad del contenido y la normalización del lenguaje.

Tuberías de enchufe LLM

Conecte modelos de lenguaje externos para corregir los errores de reconocimiento de OCR y restaurar el texto incompleto o fragmentado.

OCR fácil de usar

Con nuestra API C# OCR, solo necesita unas pocas líneas de código C# para convertir la imagen en texto, crear un PDF de búsqueda, guardar resultados de reconocimiento para documentar y muchos más. Explore las muestras de código para comprender cómo integrar nuestra API OCR en sus soluciones .NET.

Instalación

.NET OCR se distribuye como un paquete nuget o como un archivo descargable con dependencias mínimas. El paquete se puede agregar a su proyecto directamente desde Microsoft Visual Studio. Simplemente instálelo en su proyecto y esté listo para extraer texto de imágenes y guardar resultados de reconocimiento en cualquiera de los formatos compatibles. Si su sistema tiene una GPU CUDA capaz, puede usar el motor OCR GPU-ACcelerated para aumentar significativamente el rendimiento de reconocimiento.

Puede comenzar a usar Aspose.OCR for .NET justo después de la instalación con algunas restricciones . Una licencia temporal elimina todas las limitaciones de la versión de prueba durante 30 días. Úselo para comenzar a construir una aplicación OCR completamente funcional y tomar la decisión final de comprar el OCR para .NET más tarde.

Extraer texto de una foto

Cuando las personas generalmente piensan en OCR (reconocimiento de caracteres ópticos), la primera asociación a menudo es con un escáner como dispositivo de captura primario. Esta asociación tiene razones históricas y aún prevalece en muchos contextos, proporcionando un entorno consistente y controlado para capturar texto impreso de documentos físicos con una calidad inigualable. Sin embargo, un escáner es un equipo especializado que no siempre está a la mano y requiere una estación de trabajo estacionaria para operar. Afortunadamente, el mundo moderno proporciona una alternativa conveniente a los escáneres tradicionales: una cámara de teléfono inteligente. Los avances en la tecnología de cámara de teléfonos inteligentes aseguran que incluso un teléfono inteligente de nivel de entrada proporcione una calidad suficiente para capturar documentos listos para OCR. Y la memoria incorporada hace que sea más fácil que nunca digitalizar grandes cantidades de documentos, periódicos, libros, letreros de la calle y otros textos sobre la marcha. Todo lo que necesita es la tecnología adecuada para convertir esas fotos en texto legible por máquina.

Nuestra biblioteca C# OCR está diseñada específicamente para reconocer todo tipo de imágenes fuera de la caja y se puede ajustar aún más para manejar incluso las fotos de baja calidad. Combinado con un teléfono inteligente moderno, le permite crear potentes aplicaciones OCR para la mayoría de las tareas de escaneo diario y reconocimiento de texto. El procesamiento de imágenes más avanzado y el análisis de la estructura de documentos se realizan en algunas líneas de código, lo que le permite centrarse en los negocios en lugar de los algoritmos matemáticos complejos, las redes neuronales y otras complejidades técnicas.

Photo OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Crear un PDF de búsqueda desde el escaneo

PDF es uno de los formatos más populares para escanear documentos en papel, especialmente debido a su capacidad para combinar múltiples páginas en un solo archivo. Este formato se usa ampliamente para el intercambio de contratos, facturas, documentos legales, pasaportes y tarjetas de identificación, y muchos otros documentos entre individuos, empresas, bancos y agencias gubernamentales. Sin embargo, cualquier PDF escaneado es esencialmente una colección de imágenes. No contiene texto legible por máquina, por lo que los usuarios no pueden buscar, copiar o manipular el contenido del documento.

Aspose .Net OCR le ofrece una forma rápida, fácil y muy confiable de convertir cualquier PDF escaneado en un documento totalmente de búsqueda e indexable. Reconoce con precisión el contenido de la página, convirtiéndolo en una capa de texto legible por máquina sobre la imagen original que se puede seleccionar, copiar, leer por software de texto a voz e incluso procesada automáticamente por traductores, resumen y otras herramientas analíticas con IA.

Agregar superposición de texto a PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Buscar texto en imágenes

Los archivos digitales, especialmente en grandes organizaciones, a menudo consisten en una vasta colección de escaneos y fotos, muchos de los cuales pueden contener documentos de varias páginas. La gestión eficiente y la organización de dichos archivos de manera efectiva es esencial para una fácil recuperación de información y navegación. Sin embargo, las imágenes no contienen texto legible por máquina, lo que hace que sea imposible buscar y analizar el contenido del documento.

La biblioteca C# OCR le permite buscar fácilmente texto en imágenes, independientemente de la fuente, el tamaño del texto, el estilo y otros parámetros. La biblioteca también admite búsquedas insensibles a casos y expresiones regulares, que son extremadamente útiles en diversas aplicaciones e industrias. Esta funcionalidad se puede utilizar para clasificar documentos basados en el contenido, las palabras clave o los patrones que se encuentran en el texto; buscar términos o cláusulas específicos dentro de acuerdos y contratos; reorganizar archivos basados en palabras clave o contenido que se encuentran dentro de ellos; Localice e identifique los datos personales dentro de los documentos, lo que facilita garantizar el cumplimiento de GDPR y administrar la información confidencial de manera más efectiva. La búsqueda de imágenes con las imágenes también permite crear flujos de trabajo automatizados y optimizar varios procesos comerciales al recibir contratos y facturas firmados.

Buscar texto en imágenes - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}

AI Postprocesamiento con LLM

Ahora puede ir más allá del reconocimiento bruto y aplicar la lógica impulsada por la IA para mejorar la calidad textual de los resultados de OCR. Los modelos de lenguaje grande (LLM) pueden corregir de manera inteligente los errores de ortografía, restaurar los límites de las palabras, aplicar reglas de gramática y adaptar el texto en función del contexto, algo que los correctores ortográficos basados en sintaxis no pueden hacer.

Este paso de posprocesamiento es ideal para escaneos de baja calidad, fotos con ruido de fondo o documentos multilingües. Puede enchufar cualquier tubería LLM que admita la entrada/salida de texto básica, o utilizar las herramientas de corrección inteligentes de Aspose Smart para obtener resultados listos para la producción.

Postprocesamiento 🧠AI con LLM - C#

// Optional logger for progress and error reporting (can be set to null)
ILogger logger = new ConsoleLogger();

// Configure AI model for postprocessing
AsposeAIModelConfig modelConfig = new AsposeAIModelConfig
{
    AllowAutoDownload = true,
    DirectoryModelPath = "D://Models", // Path to local or downloaded model files
};

// Initialize AI postprocessing engine
AsposeAI aiEngine = new AsposeAI(modelConfig, logger);

// Register a spell-checking processor
aiEngine.AddPostProcessor(new SpellCheckAIProcessor());

// Execute AI-based postprocessing on OCR results
aiEngine.RunPostprocessor(ocrResults);

// Output the refined recognition result
Console.WriteLine("Corrected OCR Output:\n");
Console.WriteLine(ocrResults[0].RecognitionText);

// Release resources
aiEngine.Dispose();