Dominio de OCR en Python: desarrollado por Aspose.OCR para Python a través de .NET
OCR: transforma imágenes en texto con Python
Más vitrinas ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
¿Por qué optar por Aspose.OCR para Python a través de .NET?
Embárquese en un viaje con Aspose.OCR para Python a través de .NET, una API de OCR versátil y fácil de usar. Incorpore la funcionalidad OCR en sus aplicaciones Python con menos de cinco líneas de código, eliminando la necesidad de redes neuronales o matemáticas complejas. Nuestro potente motor de OCR ofrece velocidad y precisión incomparables y admite 28 idiomas, incluidos alfabetos latino, cirílico y chino. Ya sean imágenes escaneadas, fotografías de teléfonos inteligentes, capturas de pantalla o archivos PDF escaneados, obtenga resultados en formatos populares de intercambio de datos y documentos. Aproveche los filtros de preprocesamiento para manejar imágenes rotadas, sesgadas y ruidosas. Optimice el rendimiento del reconocimiento y la carga del sistema descargando tareas que consumen muchos recursos al backend de .NET.
Dominio del OCR eficiente y preciso
Experimente una velocidad y precisión incomparables en los resultados de OCR con la tecnología avanzada Python y .NET.
Excelencia multilingüe
Reconozca texto en 28 idiomas, que abarcan escrituras latina, cirílica y china con facilidad y precisión.
Procesamiento de imágenes adaptable
Procese sin esfuerzo imágenes de diversas fuentes (escáneres, cámaras y teléfonos inteligentes) utilizando Python y .NET.
Dominio del carácter chino
Logre un reconocimiento preciso de más de 6000 caracteres chinos, garantizando la precisión con Python y .NET.
Preservación de estilos y formatos de fuente
Mantenga los estilos de fuente y el formato para una representación precisa del texto, mejorando la versatilidad con Python y .NET.
Ejemplo de código en vivo
Experimente la simplicidad: ¡convierta una imagen en texto en solo tres líneas de código Python!
* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.
Convertir imagen a texto
Descubra más ejemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Empoderamiento de .NET para Python en cada rincón
Aspose.OCR para Python a través de .NET funciona perfectamente en cualquier plataforma que admita .NET Framework 4.0 y posterior , ya sea una máquina local, web servidor o la nube.
Formatos de archivo admitidos
Aspose.OCR for Python via .NET puede trabajar con prácticamente cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se devuelven en los formatos de intercambio de datos y archivos más populares que se pueden guardar, importar a una base de datos o analizar en tiempo real.
Imágenes
- JPEG
- PNG
- TIFF
- BMP
- GIF
OCR por lotes
- Multi-page PDF
- DjVu
- ZIP
- Folder
Resultados del reconocimiento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalación para Python con backend .NET
Aspose.OCR para Python a través de .NET se entrega como un paquete Python con dependencias mínimas o como un archivo descargable . Instálelo fácilmente en su proyecto y estará listo para reconocer textos en varios idiomas admitidos y guardar los resultados del reconocimiento en varios formatos.
Solicite una licencia de prueba para iniciar el desarrollo de una aplicación de OCR completamente funcional y sin limitaciones.
Potente OCR para aplicaciones Python
Nuestra biblioteca se integra fácilmente, lo que permite que las aplicaciones Python se ejecuten sin problemas en cualquier plataforma: Windows de escritorio, Windows Server, macOS, Linux y la nube.
28 idiomas de reconocimiento
Nuestra API de Python y .NET OCR reconoce una gran cantidad de lenguajes y scripts de escritura populares, incluidos lenguajes mixtos:
Deje la detección de idioma en manos de la biblioteca o defina el idioma usted mismo para mejorar el rendimiento y la confiabilidad del reconocimiento.
- Alfabeto latino extendido: alemán, croata, checo, danés, holandés, inglés, estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano, eslovaco, esloveno, español, sueco;
- Alfabeto cirílico: bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano;
- Chino: más de 6000 caracteres;
- Hindi.
Potentes filtros de procesamiento
La precisión y confiabilidad del reconocimiento óptico de caracteres depende en gran medida de la calidad de la imagen original. Aspose.OCR para Python a través de .NET ofrece una gran cantidad de filtros de procesamiento de imágenes manuales y totalmente automatizados que mejoran una imagen antes de enviarla al motor de OCR:
- Enderezar automáticamente las imágenes alineadas con un ligero ángulo con respecto a la horizontal.
- Gire manualmente imágenes muy sesgadas.
- Elimina automáticamente suciedad, manchas, rayones, reflejos, gradientes no deseados y otros ruidos.
- Ajusta automáticamente el contraste de la imagen.
- Mejora automáticamente o cambia el tamaño de la imagen manualmente.
- Convierte imágenes a blanco y negro o escala de grises.
- Invierta los colores de la imagen para que las áreas claras parezcan oscuras y las áreas oscuras parezcan claras.
- Aumenta el grosor de los caracteres de una imagen.
- Desenfoque las imágenes ruidosas conservando los bordes de las letras.
- Enderezar la curvatura de la página y corregir la distorsión de la lente de la cámara para las fotografías de la página.
Optimizado para tipos de documentos específicos
Aspose.OCR para Python vía .NET ofrece redes neuronales especialmente entrenadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:
Corrector ortográfico incorporado
Aunque Aspose.OCR para Python a través de .NET proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden provocar que ciertos caracteres o palabras se reconozcan incorrectamente. Para mejorar aún más los resultados del reconocimiento, puede activar el corrector ortográfico, que busca y corrige automáticamente los errores ortográficos según el idioma de reconocimiento seleccionado.
Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios ortográficos comunes, puede proporcionar sus propias listas de palabras.
Reconocimiento por lotes simplificado
Nuestra API Python OCR le libera de reconocer imágenes una por una. Emplee varios métodos de procesamiento por lotes para reconocer varias imágenes en una sola llamada:
- Reconocimiento de archivos PDF, TIFF y DjVu de varias páginas.
- Reconocimiento de todos los archivos de una carpeta.
- Reconocimiento de todos los archivos de un archivo.
- Reconocimiento de todos los archivos de una lista.
Aprender a través de ejemplos de Python
Aspose.OCR para Python vía .NET proporciona una variedad de ejemplos escritos en Python, lo que le permite familiarizarse rápidamente con sus funciones. y capacidades. Obtenga información para crear soluciones personalizadas que satisfagan sus necesidades comerciales de Python.
Características y capacidades
Aspose.OCR for Python via .NET Explore las capacidades avanzadas de Aspose.OCR para C++.
OCR de fotos
Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.
PDF con capacidad de búsqueda
Convierta cualquier escaneo en un documento indexable y con capacidad de búsqueda completa.
reconocimiento de URL
Reconocer una imagen desde la URL sin descargarla localmente.
Reconocimiento masivo
Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.
Cualquier fuente y estilo
Identifique y reconozca texto en todos los tipos de letra y estilos populares.
Reconocimiento preciso
Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.
Corrector ortográfico
Mejore los resultados corrigiendo automáticamente las palabras mal escritas.
Buscar texto en imágenes
Busque texto o expresión regular dentro de un conjunto de imágenes.
Comparar textos de imágenes
Compare textos en dos imágenes, independientemente del caso y el diseño.
Ejemplos de código Python
Profundice en ejemplos de código para integrar perfectamente Aspose.OCR para Python a través de .NET en sus aplicaciones Python.
Dominio de la instalación en Python
Distribuido como Python Wheel o paquete descargable independiente, Aspose.OCR para Python a través de .NET se distribuye fácilmente. La integración en su proyecto Python, directamente desde su entorno de desarrollo integrado (IDE) Python preferido, es un proceso perfecto. Simplemente instálelo y estará preparado para aprovechar la gama completa de capacidades de OCR, guardando los resultados del reconocimiento en varios formatos.
Después de la instalación, puede comenzar a usar Aspose.OCR para Python a través de .NET inmediatamente , aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR completamente funcional, lo que le permitirá tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de .NET en una etapa posterior.
Cargar licencia
lic = License()
lic.set_license(self.licPath)
Reconocer texto en fotos
Leer texto de cualquier contenido en Aspose.OCR para Python a través de .NET es tan fácil como llamar a un método universal de reconocimiento().
Convertir foto en texto - Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Convertidor universal de Python
Nuestra API lee hábilmente cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, imágenes JPEG, PNG, TIFF, GIF, BMP e incluso archivos DjVu. La compatibilidad total con documentos PDF de varias páginas, TIFF e imágenes DjVu garantiza la versatilidad. También puedes proporcionar una imagen de la web a través de una URL.
Los resultados del reconocimiento se devuelven en formatos populares de intercambio de datos y documentos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.
Reconocer PDF y guardar resultados en varios formatos de salida - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Optimización de recursos en Python
El reconocimiento óptico de caracteres exige recursos. Nuestra API ofrece formas flexibles de equilibrar la clásica tríada tiempo-precio-calidad:
- Elija entre reconocimiento exhaustivo y reconocimiento rápido.
- Especifique la cantidad de subprocesos asignados para el reconocimiento o permita que la biblioteca escale automáticamente a la cantidad de núcleos de procesador.
- Libere la CPU descargando los cálculos al backend .NET.
Reconocimiento rápido: Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Reconocer una sola línea
Si su imagen ya está recortada a una sola línea de texto, puede reconocerse en el modo más rápido posible, sin correcciones automáticas, detección de estructura de contenido y otros pasos que consumen recursos. Puede acelerar el OCR hasta 7 veces más rápido que el proceso de reconocimiento normal.
Reconocer una sola línea de texto en una imagen - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)