Convertir la imagen en texto con Python OCR API a través de Java
Reconocer texto en imágenes con Python
Más exhibiciones ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
¿Por qué aspirar.ocr por Python a través de Java?
Aspose.OCR para Python a través de Java integra perfectamente las potentes capacidades de reconocimiento de caracteres ópticos (OCR) en sus cuadernos y aplicaciones de Python multiplataforma. Con nuestra API intuitiva y de alta velocidad, puede extraer texto sin esfuerzo de escaneos, capturas de pantalla, enlaces web o fotos de teléfonos inteligentes, entregando resultados listos para la consolidación, análisis o almacenamiento. Reconocer imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla y PDF escaneados, guardando resultados en formatos de documentos populares. Los filtros de preprocesamiento avanzado manejan imágenes rotadas, sesgadas y ruidosas. Optimizar el rendimiento descargando tareas a la GPU.

OCR rápido y preciso
Lograr resultados de OCR de alta velocidad y precisos con nuestra Python avanzada a través de la tecnología Java.
Soporte multilingüe
Reconocer el texto en más de 140 idiomas, incluidos los guiones latinos, cirílicos, árabes, persa, indic y chinos, asegurando la versatilidad para sus aplicaciones de Python a través de Java.
Soporte de imagen flexible
Procese imágenes de escáneres, cámaras y teléfonos inteligentes sin problemas con Python a través de Java.
Precisión en el reconocimiento de personajes chinos
Reconozca más de 6,000 caracteres chinos con precisión en sus proyectos de Python a través de Java.
Preservar estilos de fuente y formato
Mantenga estilos de fuente y formateo para una representación precisa del texto reconocido en sus aplicaciones de Python a través de Java.
Muestra de código en vivo
Inicie el reconocimiento de texto desde las imágenes en solo tres líneas de código. ¡Experimenta la simplicidad!
* Al cargar sus archivos o utilizando el servicio que acepta con nuestro Condiciones de uso y política de privacidad.
Convertir la imagen en texto
Más ejemplos ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Elige tu preferencia
Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.
Versatilidad
Python via .NET
Uniformidad
Python via Java
Actuación
Python via C++
Compatibilidad de backend de Java
Diseñado como un módulo de Python, nuestra biblioteca garantiza la compatibilidad entre los principales sistemas operativos que admiten Java , incluidos Microsoft Windows, Linux y Macos, o las plataformas en la nube. Esto le permite desarrollar aplicaciones en una plataforma y ejecutarlas sin problemas en otra, eliminando la necesidad de cualquier modificación del código.
Formatos de archivo compatibles
Aspose.OCR for Python via Java puede funcionar con cualquier archivo Puede obtener de un escáner o cámara. Los resultados de reconocimiento se pueden guardar, importar a una base de datos o analizarse en tiempo real.
Imágenes
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
OCR por lotes
- Multi-page PDF
- ZIP
- Folder
Resultados de reconocimiento
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Instalación sin esfuerzo para Python a través de Java
Aspose.OCR para Python a través de Java se entrega como un paquete de Python o como un archivo descargable con dependencias mínimas. Fácilmente instalar en su proyecto, y está listo para reconocer los textos en múltiples idiomas compatibles y guardar resultados de reconocimiento en varios formatos.
Solicite una licencia de prueba para iniciar el desarrollo de una aplicación OCR totalmente funcional sin limitaciones.
Potente OCR para aplicaciones de Python
Nuestra biblioteca se integra fácilmente, permitiendo que las aplicaciones de Python se ejecuten perfectamente en cualquier plataforma: Windows de escritorio, Windows Server, MacOS, Linux y la nube.
140+ lenguajes de reconocimiento
Nuestra API de Python y Java OCR reconoce una gran cantidad de idiomas y guiones de escritura populares, incluidos idiomas mixtos:
Deje la detección del idioma en la biblioteca o defina el idioma usted mismo para su mayor rendimiento y confiabilidad de reconocimiento.
- ** Latín extendido ** Alfabeto: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 más;
- ** Cirílico ** Alfabeto: ruso, ucraniano, kazajos, serbio, bielorrusa, búlgaro;
- Árabe, persa, urdu;
- Guión chino y Devanagari, incluidos hindi, marathi, bhojpuri y otros.
Filtros de procesamiento de imágenes mejorados
La precisión del reconocimiento de caracteres ópticos se basa en gran medida en la calidad de la imagen original. Aspose.OCR para Python a través de Java ofrece una amplia gama de filtros de procesamiento de imágenes automatizados y manuales para optimizar una imagen antes de enviar al motor OCR:
- Enderezar automáticamente las imágenes ligeramente inclinadas.
- Corrija manualmente la rotación de imágenes severamente sesgadas.
- Retire automáticamente la suciedad, las manchas, los rasguños, el resplandor, los gradientes no deseados y otros tipos de ruido.
- Ajuste automáticamente el contraste de la imagen.
- Automáticamente compensación o cambiar el tamaño manual de la imagen.
- Convierta las imágenes en blanco y negro o escala de grises.
- Invertir los colores de la imagen, hacer que las áreas claras parezcan áreas oscuras y oscuras parecen claras.
- Aumente el grosor de los caracteres en una imagen.
- Desduza las imágenes ruidosas mientras preserva los bordes de las letras.
- Enderezar la sesgo de página y corregir la distorsión de la lente de la cámara en las fotos de la página.
API especilizadas para varios tipos de documentos
Aspose.OCR para Python a través de Java ofrece redes neuronales especialmente capacitadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:
- Tarjetas de identificación escaneadas o fotografiadas.
- Placas de licencia de vehículos.
- Facturas.
- Ingresos.
Corrector ortográfico incorporado
Aunque Aspose.OCR para Python a través de Java proporciona una alta precisión de reconocimiento, la impresión de defectos, la suciedad o las fuentes no estándar pueden hacer que ciertos caracteres o palabras sean reconocidos incorrectamente. Para mejorar aún más los resultados de reconocimiento, puede activar el corrector ortográfico, que encuentra y corrige automáticamente los errores de ortografía en función del lenguaje de reconocimiento seleccionado.
Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios de ortografía comunes, puede proporcionar sus propias listas de palabras.
Reconocimiento de lotes eficiente
Nuestra API de Python OCR te permite agilizar el reconocimiento de imágenes. Utilice métodos versátiles de procesamiento por lotes para un procesamiento eficiente de múltiples imágenes en una sola llamada:
- Reconocer archivos PDF, TIFF de varias páginas.
- Procese todos los archivos dentro de una carpeta.
- Manejar el reconocimiento de todos los archivos en un archivo.
- Reconocer imágenes de una lista especificada.
Aprendiendo a través de ejemplos de python
Explore una variedad de Ejemplos de Python diseñado para ayudarlo a comprender rápidamente las funciones y capacidades de nuestra solución OCR. Obtenga rápidamente información sobre la creación de soluciones personalizadas que cumplan con sus requisitos comerciales específicos.
Características y capacidades
Aspose.OCR for Python via Java Explore las características avanzadas de Aspose.OCR para Python
Foto OCR
Extraiga el texto de las fotos del teléfono inteligente con precisión de nivel de escaneo.
PDF de búsqueda
Convierta cualquier escaneo en un documento totalmente de búsqueda e indexable.
Reconocimiento de URL
Reconocer una imagen de URL sin descargarla localmente.
Reconocimiento masivo
Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.
Cualquier fuente y estilo
Identificar y reconocer el texto en todos los tipos de letra y estilos populares.
Reconocimiento de afinidad
Ajuste cada parámetro OCR para obtener mejores resultados de reconocimiento.
Corrector ortográfico
Mejorar los resultados corrigiendo automáticamente las palabras mal escritas.
Encuentra texto en las imágenes
Busque texto o expresión regular dentro de un conjunto de imágenes.
Comparar textos de imagen
Compare textos en dos imágenes, independientemente del caso y el diseño.
Muestras de código de python
Descubra muestras de código para integrar a la perfección Aspose.OCR para Python a través de Java en sus aplicaciones.
Instalación sin esfuerzo
Como un paquete de Python o un archivo descargable con dependencias mínimas, Aspose.OCR para Python a través de Java garantiza una distribución fácil. Integrarlo en su proyecto directamente desde Python, y está preparado para aprovechar las capacidades de OCR completas, ahorrando los resultados de reconocimiento en varios formatos.
después de la instalación, comienza rápidamente usando Aspose.OCR para Python a través de Java, aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR totalmente funcional, lo que le permite tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de Java más tarde.
Licencia de carga
lic = License()
lic.set_license(self.licPath)
Reconocimiento de imágenes
El desafío principal en las aplicaciones OCR es la escasez de escáneres para los usuarios finales. Nuestra API, integrada sin problemas con Python a través de Java, presenta filtros de preprocesamiento de imágenes incorporados robustos que manejan imágenes rotadas, sesgadas y ruidosas. Combinado con soporte para todos los formatos de imagen, permite un reconocimiento confiable, incluso de las fotos de teléfonos inteligentes. La mayoría de los procesos previos y la corrección de imágenes están automatizadas, lo que requiere su intervención solo en casos desafiantes.
Aplicar correcciones automáticas de imágenes - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
Nuestra API lee con expertos cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, JPEG, PNG, TIFF, GIF, archivos BMP. El soporte completo para documentos PDF de varias páginas, TIFF e imágenes DJVU garantiza la versatilidad. También puede proporcionar una imagen desde la web a través de una URL.
Los resultados de reconocimiento se devuelven en formatos populares de documentos y intercambio de datos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.
Reconocer PDF y guardar resultados en varios formatos de salida - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimización del uso de recursos
OCR ofrece un algoritmo de reconocimiento especial para extraer contenido de imágenes con texto escaso y fondos ruidosos/de colores. Este método mejora significativamente la precisión de OCR en los siguientes casos comerciales:
- Lea el texto de las fotos de la calle.
- Segmento e identificar letreros y letreros de carretera dentro de las imágenes de la calle.
- Localice las etiquetas de precios e interprete el texto extraído como precios.
- Encuentre y agregue regiones de interés en las etiquetas de los alimentos, como información nutricional o listas de ingredientes.
- Identificar y analizar placas de automóviles.
- Extraer texto de menús y catálogos.
Área abierta OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extraer texto de las fotos de la calle
OCR para Python ofrece un algoritmo de reconocimiento especial que extrae texto de placas de vehículos, incluidas fotos oscuras y borrosas. El texto resultante se puede guardar automáticamente en la base de datos o verificar automáticamente.
Reconocer el número de automóvil - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)