API de reconocimiento óptico de caracteres para Python

Extraiga texto de imágenes escaneadas, fotos y capturas de pantalla, cree archivos PDF con capacidad de búsqueda, busque y compare texto en imágenes y más desde aplicaciones de Python.

Aspose.OCR for Python via .NET es un motor de reconocimiento óptico de caracteres (OCR) potente y fácil de usar para sus aplicaciones Python y portátiles. En menos de 10 líneas de código, puede reconocer texto en 28 idiomas basados en alfabetos latinos, cirílicos y asiáticos, devolviendo resultados en los formatos de intercambio de datos y documentos más populares. No es necesario aprender modelos matemáticos complejos, crear algoritmos de aprendizaje automático y entrenar redes neuronales — nuestra API simple y robusta hará todo por usted.

La biblioteca funciona igual de bien con todas las fuentes, desde un escaneo de alta calidad hasta una foto rápida en un teléfono inteligente. Si la imagen está girada, distorsionada o ruidosa: Los filtros automáticos de procesamiento previo y posterior brindan la mayor precisión de reconocimiento en el menor tiempo.

De un vistazo

Extraiga texto en los principales idiomas europeos y asiáticos de cualquier tipo de imagen

Tipos de imagen

Fotos
Libros
Artículos
Contratos
Tarjetas de identificación
Pasaportes
Recibos
Facturas
Placas de matrícula
y más...

Idiomas admitidos

Inglés
chino
Hindi
alemán
francés
Español
ruso
italiano
polaco
y más...

Aspose.OCR

Independencia de la plataforma

Aspose.OCR for Python via .NET funciona bajo Python versión 3.6 o posterior

Desktop OS

Windows 7
Windows 8
Windows 10
Windows 11
Linux

Server OS

Windows Server 2008
Windows Server 2012
Windows Server 2016
Windows Server 2019
Windows Server 2022

Aspose.OCR

Formatos de archivo admitidos

Convierta cualquier imagen de un escáner, cámara o Internet a los formatos de intercambio de datos y documentos más populares

Archivos fuente

PDF
JPEG
PNG
TIFF
GIF
BMP
DjVu

Resultados de reconocimiento

Searchable PDF
Microsoft Word
Microsoft Excel
EPUB
Plain text
JSON
XML

Aspose.OCR

Características y capacidades

Extraiga texto de escaneos, fotos y capturas de pantalla

Convierta PDF escaneados en PDF indexables y con capacidad de búsqueda

Lea escrituras latinas, cirílicas y asiáticas en todos los tipos de letra populares

Reconoce más de 6.000 caracteres chinos

Trabaje con imágenes borrosas, distorsionadas, giradas y ruidosas

Identifique y conserve bloques de contenido del diseño de texto original

Detecta y lee áreas de una imagen: párrafos, líneas y palabras sueltas

Procesamiento masivo de documentos, carpetas y archivos de varias páginas

Reconocer imágenes de Internet sin descargar

Identifique y corrija automáticamente las palabras mal escritas

Encuentre texto en imágenes y compare textos de imágenes de forma inteligente

Fácil de usar

Solo necesitas 5 líneas de código para reconocer la imagen y mostrar el resultado. ¡Sí, realmente es así de simple!

Listo para reconocer Reconociendo Suelte un archivo aquí o haga clic para navegar *

* Al cargar sus archivos o utilizar el servicio, acepta nuestros Condiciones de uso y Política de privacidad.

Ejemplo de código en vivo - Python 3

# Inicializar motor OCR
recognitionEngine = AsposeOcr()
# Agregar imagen al lote
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extraer texto de la imagen
result = recognitionEngine.recognize(input)
# Mostrar el resultado del reconocimiento
print(result[0].recognition_text)

Resultado del reconocimiento

28 idiomas de reconocimiento

Aspose.OCR for Python via .NET puede reconocer una gran cantidad de idiomas y todos los scripts de escritura populares, incluidos textos con idiomas mixtos:

Alfabeto latino extendido: croata, checo, danés, holandés, inglés (incluida la escritura manuscrita), estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano , eslovaco, esloveno, español, sueco.
Alfabeto cirílico: bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano.
Chino: más de 6000 caracteres.
Hindi

También puede leer textos en otros idiomas basados en latín extendido y cirílico, incluso si no son compatibles directamente con el motor OCR. Por ejemplo, latín, vietnamita, gaélico, etc.

Potentes filtros de procesamiento

La precisión y confiabilidad del reconocimiento óptico de caracteres depende en gran medida de la calidad de la imagen original. Aspose.OCR para Python a través de .NET ofrece una gran cantidad de filtros de procesamiento de imágenes totalmente automatizados y manuales que mejoran una imagen antes de enviarla al motor OCR:

Enderezar automáticamente las imágenes alineadas con un ligero ángulo con respecto a la horizontal.
Rote manualmente las imágenes muy sesgadas.
Elimine automáticamente la suciedad, las manchas, los rayones, los reflejos, los gradientes no deseados y otros ruidos.
Ajuste automáticamente el contraste de la imagen.
Ampliar automáticamente o cambiar manualmente el tamaño de la imagen.
Convierta imágenes a blanco y negro o escala de grises.
Invierta los colores de la imagen para que las áreas claras se vean oscuras y las áreas oscuras se vean claras.
Aumenta el grosor de los caracteres en una imagen.
Desenfoque de imágenes ruidosas conservando los bordes de las letras.
Enderezar la curvatura de la página y corregir la distorsión de la lente de la cámara para las fotos de la página.

Estos filtros se pueden combinar y aplicar a toda la imagen o solo a áreas seleccionadas de la imagen, así como en el procesamiento por lotes. No solo puede ajustar el preprocesamiento en la canalización de reconocimiento, sino que también puede almacenar imágenes procesadas para visualización, almacenamiento en caché y depuración.

Optimizado para tipos de documentos específicos

Aspose.OCR for Python via .NET ofrece redes neuronales especialmente entrenadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:

Tarjetas de identidad y pasaportes escaneados o fotografiados.
Placas de vehículos.
Facturas.
Recibos.

Corrector ortográfico incorporado

Aunque Aspose.OCR for Python via .NET proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden hacer que ciertos caracteres o palabras se reconozcan incorrectamente. Para mejorar aún más los resultados del reconocimiento, puede activar el corrector ortográfico, que encuentra y corrige automáticamente los errores ortográficos según el idioma de reconocimiento seleccionado.

Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios ortográficos comunes, puede proporcionar sus propias listas de palabras.

Creación de archivos PDF con capacidad de búsqueda

Incluso con la mayor precisión de reconocimiento, la imagen original puede contener mucha información importante no textual o simplemente tener un gran valor histórico. Aspose.OCR for Python via .NET ofrece una solución simple y elegante para combinar lo mejor de ambos mundos. Extraemos texto de una imagen, documento PDF o paquete de archivos y lo colocamos como una capa de texto invisible sobre las imágenes originales. El resultado se guarda en formato PDF, que es el estándar de la industria para almacenar y compartir documentos. Los archivos resultantes se pueden buscar e indexar, y el texto se puede seleccionar y copiar de la misma manera que si hubiera seleccionado y copiado los caracteres originales.

Reconocimiento masivo

Aspose.OCR para Python a través de .NET le permite reconocer múltiples archivos, independientemente de su número y tipo, tan simple como leer una sola imagen. Con una sola llamada a la API, puede reconocer varias páginas de un escáner de alimentación automática o extraer matrículas de vehículos de cámaras de tráfico automáticas.

Los resultados se pueden guardar como documentos PDF u hojas de cálculo con capacidad de búsqueda, o se pueden devolver como texto sin formato, JSON o XML para un análisis más detallado.

Support and Learning Resources

¿Por qué Aspose.OCR for Python via .NET?
Lista de clientes
Historias de éxito

Download Free Trial Pricing Information

Aspose también ofrece API nativas de OCR para otros lenguajes de programación populares:

API de reconocimiento óptico de caracteres para Python

Extraiga texto de imágenes escaneadas, fotos y capturas de pantalla, cree archivos PDF con capacidad de búsqueda, busque y compare texto en imágenes y más desde aplicaciones de Python.

Aspose.OCR for Python via .NET

Overview

De un vistazo

Independencia de la plataforma

Formatos de archivo admitidos

Características y capacidades

Fácil de usar

Ejemplo de código en vivo - Python 3

28 idiomas de reconocimiento

Potentes filtros de procesamiento

Optimizado para tipos de documentos específicos

Corrector ortográfico incorporado

Creación de archivos PDF con capacidad de búsqueda

Reconocimiento masivo

Support and Learning Resources

Aspose.OCR forJava

Aspose.OCR forC++

Aspose.OCR for.NET