Dominio de la conversión de imagen a texto con Python a través de Java
Reconocer texto en imágenes con Python
Más vitrinas ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
¿Por qué Aspose.OCR para Python a través de Java?
Aspose.OCR para Python a través de Java integra a la perfección potentes capacidades de reconocimiento óptico de caracteres (OCR) en sus aplicaciones y cuadernos Python multiplataforma. Con nuestra API intuitiva y de alta velocidad, puede extraer sin esfuerzo texto de escaneos, capturas de pantalla, enlaces web o fotografías de teléfonos inteligentes, entregando resultados que están listos para su consolidación, análisis o almacenamiento. Reconozca imágenes escaneadas, fotografías de teléfonos inteligentes, capturas de pantalla y archivos PDF escaneados, guardando los resultados en formatos de documentos populares. Los filtros de preprocesamiento avanzados manejan imágenes rotadas, sesgadas y ruidosas. Optimice el rendimiento descargando tareas a la GPU.
OCR rápido y preciso
Logre resultados de OCR precisos y de alta velocidad con nuestra avanzada tecnología Python a través de Java.
Soporte multilingüe
Reconozca texto en más de 130 idiomas, incluidos alfabetos latinos, cirílicos, árabes, persas, índicos y chinos, lo que garantiza versatilidad para sus aplicaciones Python a través de Java.
Soporte de imagen flexible
Procese imágenes de escáneres, cámaras y teléfonos inteligentes sin problemas con Python a través de Java.
Precisión en el reconocimiento de caracteres chinos
Reconozca más de 6000 caracteres chinos con precisión en sus proyectos Python a través de Java.
Conservar estilos de fuente y formato
Mantenga los estilos de fuente y el formato para una representación precisa del texto reconocido en sus aplicaciones Python a través de Java.
Ejemplo de código en vivo
Inicie el reconocimiento de texto a partir de imágenes en solo tres líneas de código. ¡Experimente la simplicidad!
* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.
Convertir imagen a texto
Más ejemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Elige tu preferencia
Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.
Versatilidad
Python via .NET
Uniformidad
Python via Java
Actuación
Python via C++
Compatibilidad con el backend de Java
Diseñada como un módulo de Python, nuestra biblioteca garantiza la compatibilidad con los principales sistemas operativos que admiten Java , incluidos Microsoft Windows, Linux y macOS, o el plataformas en la nube. Esto le permite desarrollar aplicaciones en una plataforma y ejecutarlas sin problemas en otra, eliminando la necesidad de realizar modificaciones en el código.
Formatos de archivo admitidos
Aspose.OCR for Python via Java puede trabajar con prácticamente cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se devuelven en los formatos de intercambio de datos y archivos más populares que se pueden guardar, importar a una base de datos o analizar en tiempo real.
Imágenes
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR por lotes
- Multi-page PDF
- ZIP
- Folder
Resultados del reconocimiento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalación sencilla de Python a través de Java
Aspose.OCR para Python a través de Java se entrega como un paquete de Python o como un archivo descargable con dependencias mínimas. Instálelo fácilmente en su proyecto y estará listo para reconocer textos en varios idiomas admitidos y guardar los resultados del reconocimiento en varios formatos.
Solicite una licencia de prueba para iniciar el desarrollo de una aplicación de OCR completamente funcional y sin limitaciones.
Potente OCR para aplicaciones Python
Nuestra biblioteca se integra fácilmente, lo que permite que las aplicaciones Python se ejecuten sin problemas en cualquier plataforma: Windows de escritorio, Windows Server, macOS, Linux y la nube.
Más de 130 idiomas de reconocimiento
Nuestra API de OCR de Python y Java reconoce una gran cantidad de lenguajes y scripts de escritura populares, incluidos lenguajes mixtos:
Deje la detección de idioma en manos de la biblioteca o defina el idioma usted mismo para mejorar el rendimiento y la confiabilidad del reconocimiento.
- Alfabeto latino extendido: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 años;
- Alfabeto cirílico: ruso, ucraniano, kazajo, serbio, bielorruso, búlgaro;
- árabe, persa, urdu;
- Escritura china y devanagari, incluidos hindi, marathi, bhojpuri y otros.
Filtros de procesamiento de imágenes mejorados
La precisión del reconocimiento óptico de caracteres depende en gran medida de la calidad de la imagen original. Aspose.OCR para Python a través de Java ofrece una amplia gama de filtros de procesamiento de imágenes manuales y automatizados para optimizar una imagen antes de enviarla al motor de OCR:
- Enderece automáticamente imágenes ligeramente inclinadas.
- Corrija manualmente la rotación de imágenes muy sesgadas.
- Elimina automáticamente suciedad, manchas, rayones, reflejos, gradientes no deseados y otros tipos de ruido.
- Ajusta automáticamente el contraste de la imagen.
- Mejora automáticamente o cambia el tamaño de la imagen manualmente.
- Convierte imágenes a blanco y negro o escala de grises.
- Invierta los colores de la imagen, haciendo que las áreas claras parezcan oscuras y las áreas oscuras parezcan claras.
- Aumenta el grosor de los caracteres de una imagen.
- Desenfoque las imágenes ruidosas conservando los bordes de las letras.
- Enderezar la inclinación de la página y corregir la distorsión de la lente de la cámara en las fotografías de la página.
API especializadas para varios tipos de documentos
Aspose.OCR para Python vía Java ofrece redes neuronales especialmente entrenadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:
- DNI y pasaportes escaneados o fotografiados.
- Matrículas de vehículos.
- Facturas.
- Ingresos.
Corrector ortográfico incorporado
Aunque Aspose.OCR para Python a través de Java proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden provocar que ciertos caracteres o palabras se reconozcan incorrectamente. Para mejorar aún más los resultados del reconocimiento, puede activar el corrector ortográfico, que busca y corrige automáticamente los errores ortográficos según el idioma de reconocimiento seleccionado.
Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios ortográficos comunes, puede proporcionar sus propias listas de palabras.
Reconocimiento de lotes eficiente
Nuestra API Python OCR le permite optimizar el reconocimiento de imágenes. Utilice métodos versátiles de procesamiento por lotes para un procesamiento eficiente de múltiples imágenes en una sola llamada:
- Reconocer archivos PDF y TIFF de varias páginas.
- Procese todos los archivos dentro de una carpeta.
- Manejar el reconocimiento de todos los archivos en un archivo.
- Reconocer imágenes de una lista específica.
Aprendizaje a través de ejemplos de Python
Explore una variedad de ejemplos de Python diseñados para ayudarlo a comprender rápidamente las funciones y capacidades de nuestra solución OCR. Obtenga rápidamente información sobre cómo crear soluciones personalizadas que satisfagan sus requisitos comerciales específicos.
Características y capacidades
Aspose.OCR for Python via Java Explore las funciones avanzadas de Aspose.OCR para Python
OCR de fotos
Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.
PDF con capacidad de búsqueda
Convierta cualquier escaneo en un documento indexable y con capacidad de búsqueda completa.
reconocimiento de URL
Reconocer una imagen desde la URL sin descargarla localmente.
Reconocimiento masivo
Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.
Cualquier fuente y estilo
Identifique y reconozca texto en todos los tipos de letra y estilos populares.
Reconocimiento preciso
Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.
Corrector ortográfico
Mejore los resultados corrigiendo automáticamente las palabras mal escritas.
Buscar texto en imágenes
Busque texto o expresión regular dentro de un conjunto de imágenes.
Comparar textos de imágenes
Compare textos en dos imágenes, independientemente del caso y el diseño.
Ejemplos de código Python
Descubra ejemplos de código para integrar perfectamente Aspose.OCR para Python a través de Java en sus aplicaciones.
Instalación sin esfuerzo
Como paquete de Python o archivo descargable con dependencias mínimas, Aspose.OCR para Python a través de Java garantiza una fácil distribución. Intégrelo en su proyecto directamente desde Python y estará preparado para aprovechar las capacidades completas de OCR, guardando los resultados del reconocimiento en varios formatos.
Después de la instalación, comience inmediatamente a usar Aspose.OCR para Python a través de Java. aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR completamente funcional, lo que le permitirá tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de Java más adelante.
Cargar licencia
lic = License()
lic.set_license(self.licPath)
Reconocimiento de imagen
El principal desafío de las aplicaciones de OCR es la escasez de escáneres para los usuarios finales. Nuestra API, perfectamente integrada con Python a través de Java, presenta robustos filtros de preprocesamiento de imágenes integrados que manejan imágenes rotadas, sesgadas y ruidosas. Combinado con la compatibilidad con todos los formatos de imagen, permite un reconocimiento fiable, incluso a partir de fotografías de teléfonos inteligentes. La mayoría del preprocesamiento y corrección de imágenes están automatizados y requieren su intervención solo en casos difíciles.
Aplicar correcciones automáticas de imágenes - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Convertidor universal de Python
Nuestra API lee hábilmente cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, archivos JPEG, PNG, TIFF, GIF, BMP. La compatibilidad total con documentos PDF de varias páginas, TIFF e imágenes DjVu garantiza la versatilidad. También puedes proporcionar una imagen de la web a través de una URL.
Los resultados del reconocimiento se devuelven en formatos populares de intercambio de datos y documentos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.
Reconocer PDF y guardar resultados en varios formatos de salida - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimización del uso de recursos
OCR ofrece un algoritmo de reconocimiento especial para extraer contenido de imágenes con texto escaso y fondos ruidosos o coloreados. Este método mejora significativamente la precisión del OCR en los siguientes casos comerciales:
- Leer texto de fotografías de la calle.
- Segmente e identifique señales de tráfico y letreros dentro de imágenes de calles.
- Localice etiquetas de precios e interprete el texto extraído como precios.
- Encuentre y agregue regiones de interés en las etiquetas de los alimentos, como información nutricional o listas de ingredientes.
- Identificar y analizar matrículas de automóviles.
- Extraiga texto de menús y catálogos.
OCR de área abierta - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extraer texto de fotos de calles
OCR para Python ofrece un algoritmo de reconocimiento especial que extrae texto de las matrículas de los vehículos, incluidas fotografías oscuras y borrosas. El texto resultante se puede guardar automáticamente en la base de datos o verificar automáticamente.
Reconocer el número de coche - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)