¿Por qué Aspose.OCR for .NET?

Aspose.OCR for .NET es una API sólida, rentable y fácil de usar para el reconocimiento óptico de caracteres. En menos de 10 líneas de código C# nativo, puede crear capacidades de OCR en sus soluciones de escritorio .NET, aplicaciones web basadas en MVC, servicios en la nube y funciones de Azure sin servidor. Extraiga texto legible por máquina a partir de escaneos, fotografías y capturas de pantalla, convierta páginas escaneadas en archivos PDF indexables y con capacidad de búsqueda, busque y compare texto en imágenes centrándose en tareas comerciales en lugar de matemáticas complejas, redes neuronales y otras complejidades técnicas. Haga clic en los elementos a continuación para obtener más información sobre nuestras características y beneficios.

Illustration ocr

Aplicaciones globales

Reconocer textos en caracteres latinos, cirílicos y asiáticos, incluidos más de 6.000 caracteres chinos e hindi.

leer todo

Recupere texto de cualquier archivo obtenido a través de un escáner o cámara y procese imágenes directamente desde enlaces web.

Resultados confiables

Logre una alta precisión de reconocimiento para todas las imágenes, incluidas aquellas que están desenfocadas, giradas, distorsionadas y con ruido.

reconocimiento por lotes

Reconocer de forma masiva todas las imágenes de carpetas y archivos; lea documentos PDF de varias páginas e imágenes TIFF.

Detección de diseño

Identifique y categorice bloques de contenido en imágenes para garantizar el orden correcto del texto extraído, independientemente del diseño.

Ejemplo de código en vivo

El reconocimiento óptico de caracteres se convierte en una tarea trivial y sencilla con Aspose.OCR, incluso para los desarrolladores nuevos en la tecnología. Sólo unas pocas líneas de código son suficientes para extraer texto de una imagen y mostrarlo en la pantalla. Realmente es así de simple: pruébalo.

Listo para reconocer Listo para reconocer Suelta un archivo aquí o haz clic para explorar *

* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.

Resultado del reconocimiento
 

Convertir imagen a texto

Más ejemplos >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Independencia de plataforma

Aspose.OCR for .NET puede funcionar en cualquier plataforma que admita .NET, .NET Core o .NET Framework, ya sea en un local máquina, en el servidor web o en la nube.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de archivo admitidos

Aspose.OCR for .NET puede trabajar con prácticamente cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se devuelven en los formatos de intercambio de datos y archivos más populares que se pueden guardar, importar a una base de datos o analizar en tiempo real.

Imágenes

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR por lotes

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Resultados del reconocimiento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Apto para cualquier contenido.

La precisión y confiabilidad del reconocimiento de texto depende en gran medida de la calidad de la imagen original. Aspose.OCR for .NET proporciona una amplia gama de filtros de procesamiento de imágenes manuales y totalmente automatizados que mejoran una imagen antes de enviarla al motor de OCR.

El potente procesamiento de imágenes y los algoritmos de detección de estructura de contenido personalizables permiten la extracción de texto de prácticamente cualquier imagen, desde escaneos de alta calidad hasta fotografías de calles. Se pueden aplicar varios filtros de procesamiento a la misma imagen para obtener la mejor calidad de reconocimiento.

Optimización de recursos

Aspose.OCR for .NET permite un equilibrio altamente flexible entre la velocidad de reconocimiento, la calidad y la utilización de recursos para cada caso de uso específico:

  • Elija entre reconocimiento exhaustivo y reconocimiento rápido.
  • Especifique la cantidad de subprocesos asignados para el reconocimiento o permita que la biblioteca escale automáticamente a la cantidad de núcleos de procesador.
  • Libere la CPU descargando los cálculos a la GPU.

28 idiomas de reconocimiento

Aspose.OCR for .NET es una solución universal para el procesamiento de documentos, extracción de datos y digitalización de contenidos a escala global. Al admitir una amplia gama de guiones escritos en Europa y Asia, está bien adaptado a cualquier escala y atiende tanto a pequeñas y medianas empresas como a corporaciones multinacionales.

Puede delegar la detección de idioma a la biblioteca o especificar manualmente el idioma, mejorando el rendimiento y la confiabilidad del reconocimiento. Se admiten los siguientes idiomas:

  • Alfabeto latino extendido: alemán, croata, checo, danés, holandés, inglés, estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano, eslovaco, esloveno, español, sueco;
  • Alfabeto cirílico: bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano;
  • Más de 6000 caracteres chinos;
  • Hindi.

Características y capacidades

Aspose.OCR for .NET extrae automáticamente texto de fotografías o imágenes escaneadas, eliminando la necesidad de volver a escribir manualmente los documentos.

Feature icon

OCR de fotos

Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.

Feature icon

PDF con capacidad de búsqueda

Convierta cualquier escaneo en un documento indexable y con capacidad de búsqueda completa.

Feature icon

reconocimiento de URL

Reconocer una imagen desde la URL sin descargarla localmente.

Feature icon

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Feature icon

Cualquier fuente y estilo

Identifique y reconozca texto en todos los tipos de letra y estilos populares.

Feature icon

Reconocimiento preciso

Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.

Feature icon

Corrector ortográfico

Mejore los resultados corrigiendo automáticamente las palabras mal escritas.

Feature icon

Buscar texto en imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Feature icon

Comparar textos de imágenes

Compare textos en dos imágenes, independientemente del caso y el diseño.

Fácil de usar

Solo necesita unas pocas líneas de código para convertir imágenes en texto, crear un PDF con capacidad de búsqueda, guardar los resultados del reconocimiento en un documento y mucho más. Explore los ejemplos de código para comprender cómo integrar Aspose.OCR for .NET en sus soluciones.

Instalación

Aspose.OCR for .NET se distribuye como un paquete NuGet o como un [archivo descargable]( https://releases.aspose.com/ ocr/net/) con dependencias mínimas. El paquete se puede agregar a su proyecto directamente desde Microsoft Visual Studio. Simplemente instálelo en su proyecto y estará listo para extraer texto de imágenes y guardar los resultados del reconocimiento en cualquiera de los formatos admitidos. Si su sistema tiene una GPU compatible con CUDA, puede utilizar el motor de OCR acelerado por GPU para aumentar significativamente el rendimiento del reconocimiento.

Puede comenzar a usar Aspose.OCR for .NET inmediatamente después de la instalación con algunas restricciones . Una licencia temporal elimina todas las limitaciones de la versión de prueba durante 30 días. Úselo para comenzar a crear una aplicación de OCR completamente funcional y tomar la decisión final de comprar Aspose.OCR for .NET más adelante.

Extraer texto de una foto

Cuando la gente suele pensar en OCR (reconocimiento óptico de caracteres), la primera asociación suele ser con un escáner como dispositivo de captura principal. Esta asociación tiene razones históricas y todavía prevalece en muchos contextos, proporcionando un entorno consistente y controlado para capturar texto impreso a partir de documentos físicos con una calidad inigualable. Sin embargo, un escáner es un equipo especializado que no siempre está a mano y requiere una estación de trabajo estacionaria para funcionar. Afortunadamente, el mundo moderno ofrece una alternativa conveniente a los escáneres tradicionales: la cámara de un teléfono inteligente. Los avances en la tecnología de las cámaras de los teléfonos inteligentes garantizan que incluso un teléfono inteligente básico proporcione calidad suficiente para capturar documentos listos para OCR. Y la memoria integrada hace que sea más fácil que nunca digitalizar grandes cantidades de documentos, periódicos, libros, señales de tráfico y otros textos sobre la marcha. Todo lo que necesitas es la tecnología adecuada para convertir esas fotos en texto legible por máquina.

Aspose.OCR for .NET está diseñado específicamente para reconocer todo tipo de imágenes listas para usar y puede ajustarse aún más para manejar incluso las fotos de baja calidad. Combinado con un teléfono inteligente moderno, le permite crear potentes aplicaciones de OCR para la mayoría de las tareas diarias de escaneo y reconocimiento de texto. El procesamiento de imágenes y el análisis de la estructura de documentos más avanzados se realizan en unas pocas líneas de código, lo que le permite centrarse en el negocio en lugar de en complejos algoritmos matemáticos, redes neuronales y otras complejidades técnicas.

OCR de fotos - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Cree un PDF con capacidad de búsqueda a partir del escaneo

PDF es uno de los formatos más populares para escanear documentos en papel, especialmente debido a su capacidad para combinar varias páginas en un solo archivo. Este formato se utiliza ampliamente para el intercambio de contratos, facturas, documentos legales, pasaportes y documentos de identidad, y muchos otros documentos entre particulares, empresas, bancos y agencias gubernamentales. Sin embargo, cualquier PDF escaneado es esencialmente una colección de imágenes. No contiene texto legible por máquina, por lo que los usuarios no pueden buscar, copiar ni manipular de otro modo el contenido del documento.

Aspose.OCR for .NET le ofrece una manera rápida, fácil y altamente confiable de convertir cualquier PDF escaneado en un documento indexable y con capacidad de búsqueda completa. Reconoce con precisión el contenido de la página y lo convierte en una capa de texto legible por máquina sobre la imagen original que puede seleccionarse, copiarse, leerse mediante software de conversión de texto a voz e incluso procesarse automáticamente mediante traductores, resumidores y otros análisis basados ​​en IA. herramientas.

Agregar superposición de texto a PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Buscar texto en imágenes

Los archivos digitales, especialmente en organizaciones grandes, a menudo constan de una vasta colección de escaneos y fotografías, muchas de las cuales pueden contener documentos de varias páginas. La gestión y organización eficiente de dichos archivos es esencial para facilitar la recuperación y navegación de la información. Sin embargo, las imágenes no contienen texto legible por máquina, lo que hace imposible buscar y analizar el contenido del documento.

Aspose.OCR for .NET le permite buscar fácilmente texto en imágenes, independientemente de la fuente, el tamaño del texto, el estilo y otros parámetros. La biblioteca también admite búsquedas que no distinguen entre mayúsculas y minúsculas y expresiones regulares, que resultan extremadamente útiles en diversas aplicaciones e industrias. Esta funcionalidad se puede utilizar para categorizar documentos según el contenido, las palabras clave o los patrones que se encuentran en el texto; buscar términos o cláusulas específicas dentro de acuerdos y contratos; reorganizar archivos en función de palabras clave o contenido que se encuentran en ellos; Localice e identifique datos personales dentro de los documentos, lo que facilita garantizar el cumplimiento del RGPD y gestionar la información confidencial de forma más eficaz. La búsqueda entre imágenes también permite crear flujos de trabajo automatizados y optimizar diversos procesos comerciales al recibir contratos y facturas firmados.

Buscar texto en imágenes - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}