Biblioteca de OCR de Python
Convierta imágenes en texto con Python OCR
Más vitrinas ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
¿Por qué Aspose.OCR para Python a través de .NET?
Embárquese en un viaje con Aspose OCR para Python a través de .NET, una API de OCR versátil y fácil de usar. Incorpore la funcionalidad OCR en sus aplicaciones Python con menos de cinco líneas de código, eliminando la necesidad de redes neuronales o matemáticas complejas. Nuestro potente motor de OCR ofrece velocidad y precisión incomparables y admite más de 130 idiomas, incluidos inglés, cirílico, árabe, persa, hindi, chino, japonés, coreano, tamil y muchos más. Ya sean imágenes escaneadas, fotografías de teléfonos inteligentes, capturas de pantalla o archivos PDF escaneados, obtenga resultados en formatos populares de intercambio de datos y documentos. Aproveche los filtros de preprocesamiento para manejar imágenes rotadas, sesgadas y ruidosas.
OCR eficiente y preciso
Experimente una velocidad y precisión incomparables en los resultados de OCR con la tecnología avanzada de Python.
Plurilingüe
Reconozca texto en más de 140 idiomas: inglés, francés, alemán, español, ruso, chino, hindi, japonés, coreano, tamil, árabe, persa y más.
Universal
Procese sin esfuerzo imágenes de diversas fuentes (escáneres, cámaras y teléfonos inteligentes) utilizando Python.
lenguas asiáticas
Logre un reconocimiento preciso de las escrituras china, árabe, devanagari y dravidiana, así como de textos en varios idiomas.
Preservar diseño
Mantenga el formato de origen para una representación precisa del texto y reconozca tablas.
Ejemplo de código en vivo
Convierta una imagen en texto en solo TRES líneas de código Python. ¡Pruébalo tú mismo!
* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.
Convertir imagen a texto
Descubre más ejemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Elige tu preferencia
Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.
Versatilidad
Python via .NET
Uniformidad
Python via Java
Actuación
Python via C++
Corre por todas partes
Independientemente del nombre, Aspose.OCR para Python a través de .NET no requiere que .NET esté instalado en la plataforma de destino. El paquete de instalación ya viene con todos los componentes necesarios y puede funcionar sin problemas en cualquier plataforma, ya sea una máquina local, un servidor web o la nube.
Formatos de archivo admitidos
Aspose.OCR for Python via .NET puede trabajar con cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se pueden guardar, importar a una base de datos o analizar en tiempo real.
Imágenes
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR por lotes
- Multi-page PDF
- DjVu
- ZIP
- Folder
Resultados del reconocimiento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalación
Aspose.OCR para Python a través de .NET se entrega como un paquete Python con dependencias mínimas o como un archivo descargable o un [paquete PyPI](https: //pypi.org/project/aspose-ocr-python-net/). Instálelo fácilmente en su proyecto y estará listo para reconocer textos en más de 140 idiomas y guardar los resultados del reconocimiento en varios formatos.
Solicite una licencia de prueba para iniciar el desarrollo de una aplicación de OCR completamente funcional y sin limitaciones.
OCR bajo Python
Nuestra biblioteca se integra fácilmente, lo que permite que las aplicaciones Python se ejecuten sin problemas en cualquier plataforma: Windows de escritorio, Windows Server, macOS, Linux y la nube.
Más de 140 idiomas de reconocimiento
Nuestra biblioteca Java OCR es una solución universal para el procesamiento de documentos, extracción de datos y digitalización de contenidos a escala global. Con soporte para una amplia gama de guiones escritos en Europa, Medio Oriente y Asia, está bien adaptado para cualquier país y negocio.
Aspose OCR para Java reconoce texto en documentos multilingües, como chino/inglés, árabe/francés o cirílico/inglés. Se admiten los siguientes idiomas:
- Latín extendido: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 años;
- Alfabeto cirílico: ruso, ucraniano, kazajo, búlgaro, incluidos textos mixtos cirílico/inglés;
- árabe, persa, urdu, incluidos textos mezclados con inglés;
- Idiomas chino, coreano, japonés, devanagari y dravidiano, incluidos hindi, tamil, marathi y otros. También se admiten textos en varios idiomas.
Potentes filtros de procesamiento
La precisión y confiabilidad del reconocimiento óptico de caracteres depende en gran medida de la calidad de la imagen original. Aspose OCR para Python a través de .NET ofrece una gran cantidad de filtros de procesamiento de imágenes manuales y totalmente automatizados que mejoran una imagen antes de enviarla al motor de OCR:
- Rotar automáticamente imágenes al revés y rotadas.
- Detecta imágenes invertidas y extrae texto blanco sobre negro.
- Elimina automáticamente suciedad, manchas, rayones, reflejos, gradientes no deseados y otros ruidos.
- Ajusta automáticamente el contraste de la imagen.
- Mejora automáticamente o cambia el tamaño de la imagen manualmente.
- Convierte imágenes a blanco y negro o escala de grises.
- Encuentre áreas de imagen potencialmente problemáticas y devuelva información sobre el tipo de defecto y sus coordenadas.
- Aumenta el grosor de los caracteres de una imagen.
- Desenfoque las imágenes ruidosas conservando los bordes de las letras.
- Enderezar la curvatura de la página y corregir la distorsión de la lente de la cámara para las fotografías de la página.
Optimizado para tipos de documentos específicos
Aspose OCR para Python vía .NET ofrece redes neuronales especialmente entrenadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:
Corrector ortográfico incorporado
Aunque nuestra biblioteca Python OCR proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden provocar que ciertos caracteres o palabras se reconozcan incorrectamente. Para mejorar aún más los resultados del reconocimiento, puede activar el corrector ortográfico, que busca y corrige automáticamente los errores ortográficos según el idioma de reconocimiento seleccionado.
Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios ortográficos comunes, puede proporcionar sus propias listas de palabras.
reconocimiento por lotes
Nuestra API Python OCR le libera de reconocer imágenes una por una. Emplee varios métodos de procesamiento por lotes para reconocer varias imágenes en una sola llamada:
- Reconocimiento de archivos PDF, TIFF y DjVu de varias páginas.
- Reconocimiento de todos los archivos de una carpeta.
- Reconocimiento de todos los archivos de un archivo.
- Reconocimiento de todos los archivos de una lista.
Aprendizaje por muestra
OCR para Python proporciona una variedad de ejemplos escritos en Python, lo que le permite familiarizarse rápidamente con sus funciones y capacidades. Obtenga información para crear soluciones personalizadas que satisfagan sus necesidades comerciales de Python.
Características y capacidades
Aspose.OCR for Python via .NET Resuelve tus tareas de forma rápida y sencilla.
OCR de fotos
Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.
PDF con capacidad de búsqueda
Convierta cualquier escaneo en un documento totalmente editable, indexable y con capacidad de búsqueda.
reconocimiento de URL
Reconocer una imagen desde la URL sin descargarla localmente.
Reconocimiento masivo
Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.
Cualquier fuente y estilo
Identifique y reconozca texto en todos los tipos de letra y estilos populares.
Reconocimiento preciso
Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.
corrector ortográfico
Mejore los resultados corrigiendo automáticamente las palabras mal escritas.
Buscar texto en imágenes
Busque texto o expresión regular dentro de un conjunto de imágenes.
Comparar textos de imágenes
Compare textos en dos imágenes, independientemente del caso y el diseño.
Ejemplos de código Python
Profundice en ejemplos de código para integrar perfectamente OCR en sus aplicaciones Python.
Instalación
Distribuido como Python Wheel o paquete descargable independiente, Aspose.OCR para Python a través de .NET se distribuye fácilmente. La integración en su proyecto Python, directamente desde su entorno de desarrollo integrado (IDE) Python preferido, es un proceso perfecto. Simplemente instálelo y estará preparado para aprovechar la gama completa de capacidades de OCR, guardando los resultados del reconocimiento en varios formatos.
Después de la instalación, puede comenzar a usar Aspose.OCR para Python a través de .NET. , aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR completamente funcional, lo que le permitirá tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de .NET en una etapa posterior.
Cargar licencia
lic = License()
lic.set_license(self.licPath)
Reconocer texto en fotos
Leer texto de cualquier contenido en Aspose OCR para Python es tan fácil como llamar a un método de reconocimiento universal.
Convertir foto en texto - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Convertidor universal de Python
Nuestra API lee hábilmente cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, imágenes JPEG, PNG, TIFF, GIF, BMP e incluso archivos DjVu. La compatibilidad total con documentos PDF de varias páginas, TIFF e imágenes DjVu garantiza la versatilidad. También puedes proporcionar una imagen de la web a través de una URL.
Los resultados del reconocimiento se devuelven en formatos populares de intercambio de datos y documentos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.
Reconocer PDF y guardar resultados en varios formatos de salida - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimización de recursos en Python
El reconocimiento óptico de caracteres exige recursos. Nuestra API ofrece formas flexibles de equilibrar la clásica tríada tiempo-precio-calidad:
- Elija entre reconocimiento exhaustivo y reconocimiento rápido.
- Especifique la cantidad de subprocesos asignados para el reconocimiento o permita que la biblioteca escale automáticamente a la cantidad de núcleos de procesador.
- Libere la CPU descargando los cálculos al backend .NET.
Reconocimiento rápido: Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Reconocer una sola línea
Si su imagen ya está recortada a una sola línea de texto, puede reconocerse en el modo más rápido posible, sin correcciones automáticas, detección de estructura de contenido y otros pasos que consumen recursos. Puede acelerar el OCR hasta 7 veces más rápido que el proceso de reconocimiento normal.
Reconocer una sola línea de texto en una imagen - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)