¿Por qué aspuso.ocr para Python a través de .net?

Embárcate en un viaje con Aspose OCR para Python a través de .NET, una API OCR versátil y fácil de usar. Incorpore la funcionalidad de OCR en sus aplicaciones de Python con menos de 5 líneas de código, eliminando la necesidad de redes matemáticas o neuronales complejas. Nuestro potente motor OCR ofrece una velocidad y precisión incomparables, apoyando más de 140 idiomas, incluidos inglés, cirílico, árabe, persa, hindi, chino, japonés, coreano, tamil y muchos más. Ya sea imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla o PDF escaneados, obtenga resultados en formatos de intercambio de documentos y documentos populares. Aproveche los filtros de preprocesamiento para manejar imágenes rotadas, sesgadas y ruidosas.

Illustration ocr

OCR eficiente y preciso

Experimente la velocidad y la precisión incomparables en los resultados de OCR con tecnología avanzada de Python.

Plurilingüe

Reconocer el texto en más de 140 idiomas: inglés, francés, alemán, español, ruso, chino, hindi, japonés, coreano, tamil, árabe, persa y más.

Universal

Procesar sin esfuerzo imágenes de diversas fuentes (escáneres, cámaras y teléfonos inteligentes, utilizando Python.

Idiomas asiáticos

Lograr un reconocimiento preciso de los guiones chinos, árabes, devanagari y dravidianos, así como textos de lenguaje mixto.

Preservar el diseño

Mantenga el formato de origen para una representación de texto precisa y reconozca tablas.

Muestra de código en vivo

Convierta una imagen en texto en solo tres líneas de código Python. ¡Prueba por ti mismo!

Listo para reconocer Listo para reconocer Deje caer un archivo aquí o haga clic para navegar *

* Al cargar sus archivos o utilizando el servicio que acepta con nuestro Condiciones de uso y política de privacidad.

Resultado de reconocimiento
 

Convertir la imagen en texto

Descubre más ejemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Elige tu preferencia

Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.

Versatilidad

Python via .NET

Desarrollo fácil, legibilidad y mantenimiento del código
Cuenta con la mayoría de las funciones y recibe las actualizaciones más frecuentes
La velocidad general puede ser un poco más lenta que otras plataformas

Uniformidad

Python via Java

Use la misma biblioteca en cualquier plataforma
Ejecute sin problemas su aplicación en cualquier dispositivo
Requiere la versión 8 o posterior de Java Runtime Environment (JRE)

Actuación

Python via C++

La velocidad más rápida posible independientemente de la plataforma
Una gran cantidad de control sobre la gestión de recursos
Dirigido a desarrolladores experimentados

Corre por todas partes

Independientemente del nombre, Aspose.OCR para Python a través de .NET no requiere que .NET se instale en la plataforma de destino. El paquete de instalación ya viene con todos los componentes requeridos y puede funcionar sin problemas en cualquier plataforma, ya sea una máquina local, un servidor web o la nube.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de archivo compatibles

Aspose.OCR for Python via .NET puede funcionar con cualquier archivo Puede obtener de un escáner o cámara. Los resultados de reconocimiento se pueden guardar, importar a una base de datos o analizarse en tiempo real.

Imágenes

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

OCR por lotes

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Resultados de reconocimiento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalación

Aspose.OCR para Python a través de .NET se entrega como un paquete de Python con dependencias mínimas o como un archivo descargable o paquete pypi . Fácilmente instalar en su proyecto, y está listo para reconocer textos en más de 140 idiomas y guardar resultados de reconocimiento en varios formatos.

Solicite una licencia de prueba para iniciar el desarrollo de una aplicación OCR totalmente funcional sin limitaciones.

OCR bajo Python

Nuestra biblioteca se integra fácilmente, permitiendo que las aplicaciones de Python se ejecuten perfectamente en cualquier plataforma: Windows de escritorio, Windows Server, MacOS, Linux y la nube.

140+ lenguajes de reconocimiento

Nuestra biblioteca Java OCR es una solución universal para el procesamiento de documentos, la extracción de datos y la digitalización de contenido a escala global. Con el apoyo a una amplia gama de guiones de escritura europeos, del Medio Oriente y Asia, está bien adaptado para cualquier país y negocio.

El aspose OCR para Java reconoce el texto en documentos multilingües, como chino/inglés, árabe/francés o cirílico/inglés. Se admiten los siguientes idiomas:

  • ** Latín extendido **: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 más;
  • ** Cirílico ** Alfabeto: ruso, ucraniano, kazajro, búlgaro, incluidos textos de cirílicos/ingleses mixtos;
  • Árabe, persa, urdu, incluidos textos mezclados con inglés;
  • Idiomas chinos, coreanos, japoneses, devanagari y dravidianos, incluidos hindi, tamil, marathi y otros. También se admiten textos de lenguaje mixto.

Filtros de procesamiento potentes

La precisión y confiabilidad del reconocimiento de caracteres ópticos depende en gran medida de la calidad de la imagen original. Aspose OCR para Python a través de .NET ofrece una gran cantidad de filtros de procesamiento de imágenes totalmente automatizados y manuales que mejoran una imagen antes de enviarla al motor OCR:

  • Gire automáticamente las imágenes al revés y giradas.
  • Detectar imágenes invertidas y extraer texto blanco sobre negro.
  • Retire automáticamente la suciedad, los puntos, los rasguños, el resplandor, los gradientes no deseados y otro ruido.
  • Ajuste automáticamente el contraste de la imagen.
  • Automáticamente compensación o cambiar el tamaño manual de la imagen.
  • Convierta las imágenes en blanco y negro o escala de grises.
  • Encuentre áreas de imagen potencialmente problemáticas y devuelva la información sobre el tipo de defecto y sus coordenadas.
  • Aumente el grosor de los caracteres en una imagen.
  • Desduza las imágenes ruidosas mientras preserva los bordes de las letras.
  • Enderezar la curvatura de la página y arreglar la distorsión de la lente de la cámara para las fotos de la página.

Optimizado para tipos de documentos específicos

Aspose OCR para Python a través de .NET ofrece redes neuronales especialmente capacitadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:

Corrector ortográfico incorporado

Aunque nuestra biblioteca Python OCR proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden hacer que ciertos caracteres o palabras sean reconocidos incorrectamente. Para mejorar aún más los resultados de reconocimiento, puede activar el corrector ortográfico, que encuentra y corrige automáticamente los errores de ortografía en función del lenguaje de reconocimiento seleccionado.

Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios de ortografía comunes, puede proporcionar sus propias listas de palabras.

Reconocimiento por lotes

Nuestra API de Python OCR te libera de reconocer imágenes una por una. Emplee varios métodos de procesamiento por lotes para reconocer múltiples imágenes en una sola llamada:

  • Reconocimiento de archivos PDF, TIFF y DJVU de varias páginas.
  • Reconocimiento de todos los archivos en una carpeta.
  • Reconocimiento de todos los archivos en un archivo.
  • Reconocimiento de todos los archivos de una lista.

Aprendizaje por muestra

OCR para Python proporciona una variedad de ejemplos escrito en Python, lo que le permite familiarizarse rápidamente con sus funciones y capacidades. Obtenga información para crear soluciones personalizadas para satisfacer sus necesidades comerciales de Python.

Características y capacidades

Aspose.OCR for Python via .NET Aspose.OCR para Python a través de .NET resuelve sus tareas de manera rápida y fácil.

Feature icon

Foto OCR

Extraiga el texto de las fotos del teléfono inteligente con precisión de nivel de escaneo.

Feature icon

PDF de búsqueda

Convierta cualquier exploración en un documento totalmente de búsqueda, indexable y editable.

Feature icon

Reconocimiento de URL

Reconocer una imagen de URL sin descargarla localmente.

Feature icon

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Feature icon

Cualquier fuente y estilo

Identificar y reconocer el texto en todos los tipos de letra y estilos populares.

Feature icon

Reconocimiento de afinidad

Ajuste cada parámetro OCR para obtener mejores resultados de reconocimiento.

Feature icon

Corrector ortográfico

Mejorar los resultados corrigiendo automáticamente las palabras mal escritas.

Feature icon

Encuentra texto en las imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Feature icon

Comparar textos de imagen

Compare textos en dos imágenes, independientemente del caso y el diseño.

Muestras de código de python

Profunda en muestras de código para integrar a la perfección OCR en sus aplicaciones de Python.

Instalación

Distribuido como una rueda de pitón o un paquete descargable autónomo, Aspose.OCR para Python a través de .NET se distribuye fácilmente. La integración en su proyecto de Python, directamente desde su entorno de desarrollo integrado de Python (IDE) preferido, es un proceso perfecto. Simplemente instálelo y esté preparado para aprovechar el rango completo de capacidades de OCR, ahorrando los resultados de reconocimiento en varios formatos.

Postinstalation, puede comenzar de inmediato a usar Aspose.OCR para Python a través de .NET, aunque con ciertas limitaciones. Una licencia temporal eleva todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR totalmente funcional, lo que le permite tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de .NET en una etapa posterior.

Licencia de carga

lic = License()
lic.set_license(self.licPath)

Reconocer texto en fotos

Leer texto de cualquier contenido en Aspose OCR para Python es tan fácil como llamar a un método de reconocimiento universal.

Convertir foto a texto - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Python Universal Converter

Nuestra API lee con expertos cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, JPEG, PNG, TIFF, GIF, imágenes BMP e incluso archivos DJVU. El soporte completo para documentos PDF de varias páginas, TIFF e imágenes DJVU garantiza la versatilidad. También puede proporcionar una imagen desde la web a través de una URL.

Los resultados de reconocimiento se devuelven en formatos populares de documentos y intercambio de datos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.

Reconocer PDF y guardar resultados en varios formatos de salida - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Optimización de recursos en Python

El reconocimiento de caracteres ópticos exige recursos. Nuestra API ofrece formas flexibles de equilibrar la tríada clásica de calidad de tiempo:

  • Elija entre reconocimiento exhaustivo y reconocimiento rápido.
  • Especifique el número de subprocesos asignados para el reconocimiento, o permita que la biblioteca escala automáticamente al número de núcleos de procesador.
  • Libere la CPU descargando cálculos al backend .NET.

Reconocimiento rápido - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Reconocer una sola línea

Si su imagen ya está recortada a una sola línea de texto, se puede reconocer en el modo más rápido posible, sin correcciones automatizadas, detección de estructura de contenido y otros pasos que consumen recursos. Puede acelerar el OCR hasta 7 veces más rápido que el proceso de reconocimiento normal.

Reconocer una sola línea de texto en la imagen - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)