Biblioteca Python OCR
Convertir imágenes en texto con Python OCR
Más exhibiciones ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
¿Por qué aspuso.ocr para Python a través de .net?
Embárcate en un viaje con Aspose OCR para Python a través de .NET, una API OCR versátil y fácil de usar. Incorpore la funcionalidad de OCR en sus aplicaciones de Python con menos de 5 líneas de código, eliminando la necesidad de redes matemáticas o neuronales complejas. Nuestro potente motor OCR ofrece una velocidad y precisión incomparables, apoyando más de 140 idiomas, incluidos inglés, cirílico, árabe, persa, hindi, chino, japonés, coreano, tamil y muchos más. Ya sea imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla o PDF escaneados, obtenga resultados en formatos de intercambio de documentos y documentos populares. Aproveche los filtros de preprocesamiento para manejar imágenes rotadas, sesgadas y ruidosas.

OCR eficiente y preciso
Experimente la velocidad y la precisión incomparables en los resultados de OCR con tecnología avanzada de Python.
Plurilingüe
Reconocer el texto en más de 140 idiomas: inglés, francés, alemán, español, ruso, chino, hindi, japonés, coreano, tamil, árabe, persa y más.
Universal
Procesar sin esfuerzo imágenes de diversas fuentes (escáneres, cámaras y teléfonos inteligentes, utilizando Python.
Idiomas asiáticos
Lograr un reconocimiento preciso de los guiones chinos, árabes, devanagari y dravidianos, así como textos de lenguaje mixto.
Preservar el diseño
Mantenga el formato de origen para una representación de texto precisa y reconozca tablas.
Muestra de código en vivo
Convierta una imagen en texto en solo tres líneas de código Python. ¡Prueba por ti mismo!
* Al cargar sus archivos o utilizando el servicio que acepta con nuestro Condiciones de uso y política de privacidad.
Convertir la imagen en texto
Descubre más ejemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Elige tu preferencia
Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.
Versatilidad
Python via .NET
Uniformidad
Python via Java
Actuación
Python via C++
Corre por todas partes
Independientemente del nombre, Aspose.OCR para Python a través de .NET no requiere que .NET se instale en la plataforma de destino. El paquete de instalación ya viene con todos los componentes requeridos y puede funcionar sin problemas en cualquier plataforma, ya sea una máquina local, un servidor web o la nube.
Formatos de archivo compatibles
Aspose.OCR for Python via .NET puede funcionar con cualquier archivo Puede obtener de un escáner o cámara. Los resultados de reconocimiento se pueden guardar, importar a una base de datos o analizarse en tiempo real.
Imágenes
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR por lotes
- Multi-page PDF
- DjVu
- ZIP
- Folder
Resultados de reconocimiento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalación
Aspose.OCR para Python a través de .NET se entrega como un paquete de Python con dependencias mínimas o como un archivo descargable o paquete pypi . Fácilmente instalar en su proyecto, y está listo para reconocer textos en más de 140 idiomas y guardar resultados de reconocimiento en varios formatos.
Solicite una licencia de prueba para iniciar el desarrollo de una aplicación OCR totalmente funcional sin limitaciones.
OCR bajo Python
Nuestra biblioteca se integra fácilmente, permitiendo que las aplicaciones de Python se ejecuten perfectamente en cualquier plataforma: Windows de escritorio, Windows Server, MacOS, Linux y la nube.
140+ lenguajes de reconocimiento
Nuestra biblioteca Java OCR es una solución universal para el procesamiento de documentos, la extracción de datos y la digitalización de contenido a escala global. Con el apoyo a una amplia gama de guiones de escritura europeos, del Medio Oriente y Asia, está bien adaptado para cualquier país y negocio.
El aspose OCR para Java reconoce el texto en documentos multilingües, como chino/inglés, árabe/francés o cirílico/inglés. Se admiten los siguientes idiomas:
- ** Latín extendido **: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 más;
- ** Cirílico ** Alfabeto: ruso, ucraniano, kazajro, búlgaro, incluidos textos de cirílicos/ingleses mixtos;
- Árabe, persa, urdu, incluidos textos mezclados con inglés;
- Idiomas chinos, coreanos, japoneses, devanagari y dravidianos, incluidos hindi, tamil, marathi y otros. También se admiten textos de lenguaje mixto.
Filtros de procesamiento potentes
La precisión y confiabilidad del reconocimiento de caracteres ópticos depende en gran medida de la calidad de la imagen original. Aspose OCR para Python a través de .NET ofrece una gran cantidad de filtros de procesamiento de imágenes totalmente automatizados y manuales que mejoran una imagen antes de enviarla al motor OCR:
- Gire automáticamente las imágenes al revés y giradas.
- Detectar imágenes invertidas y extraer texto blanco sobre negro.
- Retire automáticamente la suciedad, los puntos, los rasguños, el resplandor, los gradientes no deseados y otro ruido.
- Ajuste automáticamente el contraste de la imagen.
- Automáticamente compensación o cambiar el tamaño manual de la imagen.
- Convierta las imágenes en blanco y negro o escala de grises.
- Encuentre áreas de imagen potencialmente problemáticas y devuelva la información sobre el tipo de defecto y sus coordenadas.
- Aumente el grosor de los caracteres en una imagen.
- Desduza las imágenes ruidosas mientras preserva los bordes de las letras.
- Enderezar la curvatura de la página y arreglar la distorsión de la lente de la cámara para las fotos de la página.
Optimizado para tipos de documentos específicos
Aspose OCR para Python a través de .NET ofrece redes neuronales especialmente capacitadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:
Corrector ortográfico incorporado
Aunque nuestra biblioteca Python OCR proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden hacer que ciertos caracteres o palabras sean reconocidos incorrectamente. Para mejorar aún más los resultados de reconocimiento, puede activar el corrector ortográfico, que encuentra y corrige automáticamente los errores de ortografía en función del lenguaje de reconocimiento seleccionado.
Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios de ortografía comunes, puede proporcionar sus propias listas de palabras.
Reconocimiento por lotes
Nuestra API de Python OCR te libera de reconocer imágenes una por una. Emplee varios métodos de procesamiento por lotes para reconocer múltiples imágenes en una sola llamada:
- Reconocimiento de archivos PDF, TIFF y DJVU de varias páginas.
- Reconocimiento de todos los archivos en una carpeta.
- Reconocimiento de todos los archivos en un archivo.
- Reconocimiento de todos los archivos de una lista.
Aprendizaje por muestra
OCR para Python proporciona una variedad de ejemplos escrito en Python, lo que le permite familiarizarse rápidamente con sus funciones y capacidades. Obtenga información para crear soluciones personalizadas para satisfacer sus necesidades comerciales de Python.
Características y capacidades
Aspose.OCR for Python via .NET Aspose.OCR para Python a través de .NET resuelve sus tareas de manera rápida y fácil.
Foto OCR
Extraiga el texto de las fotos del teléfono inteligente con precisión de nivel de escaneo.
PDF de búsqueda
Convierta cualquier exploración en un documento totalmente de búsqueda, indexable y editable.
Reconocimiento de URL
Reconocer una imagen de URL sin descargarla localmente.
Reconocimiento masivo
Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.
Cualquier fuente y estilo
Identificar y reconocer el texto en todos los tipos de letra y estilos populares.
Reconocimiento de afinidad
Ajuste cada parámetro OCR para obtener mejores resultados de reconocimiento.
Corrector ortográfico
Mejorar los resultados corrigiendo automáticamente las palabras mal escritas.
Encuentra texto en las imágenes
Busque texto o expresión regular dentro de un conjunto de imágenes.
Comparar textos de imagen
Compare textos en dos imágenes, independientemente del caso y el diseño.
Muestras de código de python
Profunda en muestras de código para integrar a la perfección OCR en sus aplicaciones de Python.
Instalación
Distribuido como una rueda de pitón o un paquete descargable autónomo, Aspose.OCR para Python a través de .NET se distribuye fácilmente. La integración en su proyecto de Python, directamente desde su entorno de desarrollo integrado de Python (IDE) preferido, es un proceso perfecto. Simplemente instálelo y esté preparado para aprovechar el rango completo de capacidades de OCR, ahorrando los resultados de reconocimiento en varios formatos.
Postinstalation, puede comenzar de inmediato a usar Aspose.OCR para Python a través de .NET, aunque con ciertas limitaciones. Una licencia temporal eleva todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR totalmente funcional, lo que le permite tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de .NET en una etapa posterior.
Licencia de carga
lic = License()
lic.set_license(self.licPath)
Reconocer texto en fotos
Leer texto de cualquier contenido en Aspose OCR para Python es tan fácil como llamar a un método de reconocimiento universal.
Convertir foto a texto - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Python Universal Converter
Nuestra API lee con expertos cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, JPEG, PNG, TIFF, GIF, imágenes BMP e incluso archivos DJVU. El soporte completo para documentos PDF de varias páginas, TIFF e imágenes DJVU garantiza la versatilidad. También puede proporcionar una imagen desde la web a través de una URL.
Los resultados de reconocimiento se devuelven en formatos populares de documentos y intercambio de datos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.
Reconocer PDF y guardar resultados en varios formatos de salida - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimización de recursos en Python
El reconocimiento de caracteres ópticos exige recursos. Nuestra API ofrece formas flexibles de equilibrar la tríada clásica de calidad de tiempo:
- Elija entre reconocimiento exhaustivo y reconocimiento rápido.
- Especifique el número de subprocesos asignados para el reconocimiento, o permita que la biblioteca escala automáticamente al número de núcleos de procesador.
- Libere la CPU descargando cálculos al backend .NET.
Reconocimiento rápido - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Reconocer una sola línea
Si su imagen ya está recortada a una sola línea de texto, se puede reconocer en el modo más rápido posible, sin correcciones automatizadas, detección de estructura de contenido y otros pasos que consumen recursos. Puede acelerar el OCR hasta 7 veces más rápido que el proceso de reconocimiento normal.
Reconocer una sola línea de texto en la imagen - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)