¿Por qué Aspose.OCR para Python a través de .NET?

Embárquese en un viaje con Aspose OCR para Python a través de .NET, una API de OCR versátil y fácil de usar. Incorpore la funcionalidad OCR en sus aplicaciones Python con menos de cinco líneas de código, eliminando la necesidad de redes neuronales o matemáticas complejas. Nuestro potente motor de OCR ofrece velocidad y precisión incomparables y admite más de 130 idiomas, incluidos inglés, cirílico, árabe, persa, hindi, chino, japonés, coreano, tamil y muchos más. Ya sean imágenes escaneadas, fotografías de teléfonos inteligentes, capturas de pantalla o archivos PDF escaneados, obtenga resultados en formatos populares de intercambio de datos y documentos. Aproveche los filtros de preprocesamiento para manejar imágenes rotadas, sesgadas y ruidosas.

Illustration ocr

OCR eficiente y preciso

Experimente una velocidad y precisión incomparables en los resultados de OCR con la tecnología avanzada de Python.

Plurilingüe

Reconozca texto en más de 140 idiomas: inglés, francés, alemán, español, ruso, chino, hindi, japonés, coreano, tamil, árabe, persa y más.

Universal

Procese sin esfuerzo imágenes de diversas fuentes (escáneres, cámaras y teléfonos inteligentes) utilizando Python.

lenguas asiáticas

Logre un reconocimiento preciso de las escrituras china, árabe, devanagari y dravidiana, así como de textos en varios idiomas.

Preservar diseño

Mantenga el formato de origen para una representación precisa del texto y reconozca tablas.

Ejemplo de código en vivo

Convierta una imagen en texto en solo TRES líneas de código Python. ¡Pruébalo tú mismo!

Listo para reconocer Listo para reconocer Suelta un archivo aquí o haz clic para explorar *

* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.

Resultado del reconocimiento
 

Convertir imagen a texto

Descubre más ejemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Elige tu preferencia

Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.

Versatilidad

Python via .NET

Fácil desarrollo, legibilidad y mantenibilidad del código.
Cuenta con la mayor cantidad de funciones y recibe las actualizaciones más frecuentes
La velocidad general puede ser un poco más lenta que en otras plataformas.

Uniformidad

Python via Java

Utilice la misma biblioteca en cualquier plataforma
Ejecute su aplicación sin problemas en cualquier dispositivo
Requiere Java Runtime Environment (JRE) versión 8 o posterior

Actuación

Python via C++

La velocidad más rápida posible independientemente de la plataforma.
Mucho control sobre la gestión de recursos.
Dirigido a desarrolladores experimentados

Corre por todas partes

Independientemente del nombre, Aspose.OCR para Python a través de .NET no requiere que .NET esté instalado en la plataforma de destino. El paquete de instalación ya viene con todos los componentes necesarios y puede funcionar sin problemas en cualquier plataforma, ya sea una máquina local, un servidor web o la nube.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de archivo admitidos

Aspose.OCR for Python via .NET puede trabajar con cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se pueden guardar, importar a una base de datos o analizar en tiempo real.

Imágenes

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR por lotes

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Resultados del reconocimiento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalación

Aspose.OCR para Python a través de .NET se entrega como un paquete Python con dependencias mínimas o como un archivo descargable o un [paquete PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Instálelo fácilmente en su proyecto y estará listo para reconocer textos en más de 140 idiomas y guardar los resultados del reconocimiento en varios formatos.

Solicite una licencia de prueba para iniciar el desarrollo de una aplicación de OCR completamente funcional y sin limitaciones.

OCR bajo Python

Nuestra biblioteca se integra fácilmente, lo que permite que las aplicaciones Python se ejecuten sin problemas en cualquier plataforma: Windows de escritorio, Windows Server, macOS, Linux y la nube.

Más de 140 idiomas de reconocimiento

Nuestra biblioteca Java OCR es una solución universal para el procesamiento de documentos, extracción de datos y digitalización de contenidos a escala global. Con soporte para una amplia gama de guiones escritos en Europa, Medio Oriente y Asia, está bien adaptado para cualquier país y negocio.

Aspose OCR para Java reconoce texto en documentos multilingües, como chino/inglés, árabe/francés o cirílico/inglés. Se admiten los siguientes idiomas:

  • Latín extendido: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 años;
  • Alfabeto cirílico: ruso, ucraniano, kazajo, búlgaro, incluidos textos mixtos cirílico/inglés;
  • árabe, persa, urdu, incluidos textos mezclados con inglés;
  • Idiomas chino, coreano, japonés, devanagari y dravidiano, incluidos hindi, tamil, marathi y otros. También se admiten textos en varios idiomas.

Potentes filtros de procesamiento

La precisión y confiabilidad del reconocimiento óptico de caracteres depende en gran medida de la calidad de la imagen original. Aspose OCR para Python a través de .NET ofrece una gran cantidad de filtros de procesamiento de imágenes manuales y totalmente automatizados que mejoran una imagen antes de enviarla al motor de OCR:

  • Rotar automáticamente imágenes al revés y rotadas.
  • Detecta imágenes invertidas y extrae texto blanco sobre negro.
  • Elimina automáticamente suciedad, manchas, rayones, reflejos, gradientes no deseados y otros ruidos.
  • Ajusta automáticamente el contraste de la imagen.
  • Mejora automáticamente o cambia el tamaño de la imagen manualmente.
  • Convierte imágenes a blanco y negro o escala de grises.
  • Encuentre áreas de imagen potencialmente problemáticas y devuelva información sobre el tipo de defecto y sus coordenadas.
  • Aumenta el grosor de los caracteres de una imagen.
  • Desenfoque las imágenes ruidosas conservando los bordes de las letras.
  • Enderezar la curvatura de la página y corregir la distorsión de la lente de la cámara para las fotografías de la página.

Optimizado para tipos de documentos específicos

Aspose OCR para Python vía .NET ofrece redes neuronales especialmente entrenadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:

Corrector ortográfico incorporado

Aunque nuestra biblioteca Python OCR proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden provocar que ciertos caracteres o palabras se reconozcan incorrectamente. Para mejorar aún más los resultados del reconocimiento, puede activar el corrector ortográfico, que busca y corrige automáticamente los errores ortográficos según el idioma de reconocimiento seleccionado.

Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios ortográficos comunes, puede proporcionar sus propias listas de palabras.

reconocimiento por lotes

Nuestra API Python OCR le libera de reconocer imágenes una por una. Emplee varios métodos de procesamiento por lotes para reconocer varias imágenes en una sola llamada:

  • Reconocimiento de archivos PDF, TIFF y DjVu de varias páginas.
  • Reconocimiento de todos los archivos de una carpeta.
  • Reconocimiento de todos los archivos de un archivo.
  • Reconocimiento de todos los archivos de una lista.

Aprendizaje por muestra

OCR para Python proporciona una variedad de ejemplos escritos en Python, lo que le permite familiarizarse rápidamente con sus funciones y capacidades. Obtenga información para crear soluciones personalizadas que satisfagan sus necesidades comerciales de Python.

Características y capacidades

Aspose.OCR for Python via .NET Resuelve tus tareas de forma rápida y sencilla.

Feature icon

OCR de fotos

Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.

Feature icon

PDF con capacidad de búsqueda

Convierta cualquier escaneo en un documento totalmente editable, indexable y con capacidad de búsqueda.

Feature icon

reconocimiento de URL

Reconocer una imagen desde la URL sin descargarla localmente.

Feature icon

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Feature icon

Cualquier fuente y estilo

Identifique y reconozca texto en todos los tipos de letra y estilos populares.

Feature icon

Reconocimiento preciso

Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.

Feature icon

corrector ortográfico

Mejore los resultados corrigiendo automáticamente las palabras mal escritas.

Feature icon

Buscar texto en imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Feature icon

Comparar textos de imágenes

Compare textos en dos imágenes, independientemente del caso y el diseño.

Ejemplos de código Python

Profundice en ejemplos de código para integrar perfectamente OCR en sus aplicaciones Python.

Instalación

Distribuido como Python Wheel o paquete descargable independiente, Aspose.OCR para Python a través de .NET se distribuye fácilmente. La integración en su proyecto Python, directamente desde su entorno de desarrollo integrado (IDE) Python preferido, es un proceso perfecto. Simplemente instálelo y estará preparado para aprovechar la gama completa de capacidades de OCR, guardando los resultados del reconocimiento en varios formatos.

Después de la instalación, puede comenzar a usar Aspose.OCR para Python a través de .NET. , aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR completamente funcional, lo que le permitirá tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de .NET en una etapa posterior.

Cargar licencia

lic = License()
lic.set_license(self.licPath)

Reconocer texto en fotos

Leer texto de cualquier contenido en Aspose OCR para Python es tan fácil como llamar a un método de reconocimiento universal.

Convertir foto en texto - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Convertidor universal de Python

Nuestra API lee hábilmente cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, imágenes JPEG, PNG, TIFF, GIF, BMP e incluso archivos DjVu. La compatibilidad total con documentos PDF de varias páginas, TIFF e imágenes DjVu garantiza la versatilidad. También puedes proporcionar una imagen de la web a través de una URL.

Los resultados del reconocimiento se devuelven en formatos populares de intercambio de datos y documentos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.

Reconocer PDF y guardar resultados en varios formatos de salida - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimización de recursos en Python

El reconocimiento óptico de caracteres exige recursos. Nuestra API ofrece formas flexibles de equilibrar la clásica tríada tiempo-precio-calidad:

  • Elija entre reconocimiento exhaustivo y reconocimiento rápido.
  • Especifique la cantidad de subprocesos asignados para el reconocimiento o permita que la biblioteca escale automáticamente a la cantidad de núcleos de procesador.
  • Libere la CPU descargando los cálculos al backend .NET.

Reconocimiento rápido: Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconocer una sola línea

Si su imagen ya está recortada a una sola línea de texto, puede reconocerse en el modo más rápido posible, sin correcciones automáticas, detección de estructura de contenido y otros pasos que consumen recursos. Puede acelerar el OCR hasta 7 veces más rápido que el proceso de reconocimiento normal.

Reconocer una sola línea de texto en una imagen - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)