¿Por qué aspirar.ocr por Python a través de Java?

Aspose.OCR para Python a través de Java integra perfectamente las potentes capacidades de reconocimiento de caracteres ópticos (OCR) en sus cuadernos y aplicaciones de Python multiplataforma. Con nuestra API intuitiva y de alta velocidad, puede extraer texto sin esfuerzo de escaneos, capturas de pantalla, enlaces web o fotos de teléfonos inteligentes, entregando resultados listos para la consolidación, análisis o almacenamiento. Reconocer imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla y PDF escaneados, guardando resultados en formatos de documentos populares. Los filtros de preprocesamiento avanzado manejan imágenes rotadas, sesgadas y ruidosas. Optimizar el rendimiento descargando tareas a la GPU.

Illustration ocr

OCR rápido y preciso

Lograr resultados de OCR de alta velocidad y precisos con nuestra Python avanzada a través de la tecnología Java.

Soporte multilingüe

Reconocer el texto en más de 140 idiomas, incluidos los guiones latinos, cirílicos, árabes, persa, indic y chinos, asegurando la versatilidad para sus aplicaciones de Python a través de Java.

Soporte de imagen flexible

Procese imágenes de escáneres, cámaras y teléfonos inteligentes sin problemas con Python a través de Java.

Precisión en el reconocimiento de personajes chinos

Reconozca más de 6,000 caracteres chinos con precisión en sus proyectos de Python a través de Java.

Preservar estilos de fuente y formato

Mantenga estilos de fuente y formateo para una representación precisa del texto reconocido en sus aplicaciones de Python a través de Java.

Muestra de código en vivo

Inicie el reconocimiento de texto desde las imágenes en solo tres líneas de código. ¡Experimenta la simplicidad!

Listo para reconocer Listo para reconocer Deje caer un archivo aquí o haga clic para navegar *

* Al cargar sus archivos o utilizando el servicio que acepta con nuestro Condiciones de uso y política de privacidad.

Resultado de reconocimiento
 

Convertir la imagen en texto

Más ejemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Elige tu preferencia

Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.

Versatilidad

Python via .NET

Desarrollo fácil, legibilidad y mantenimiento del código
Cuenta con la mayoría de las funciones y recibe las actualizaciones más frecuentes
La velocidad general puede ser un poco más lenta que otras plataformas

Uniformidad

Python via Java

Use la misma biblioteca en cualquier plataforma
Ejecute sin problemas su aplicación en cualquier dispositivo
Requiere la versión 8 o posterior de Java Runtime Environment (JRE)

Actuación

Python via C++

La velocidad más rápida posible independientemente de la plataforma
Una gran cantidad de control sobre la gestión de recursos
Dirigido a desarrolladores experimentados

Compatibilidad de backend de Java

Diseñado como un módulo de Python, nuestra biblioteca garantiza la compatibilidad entre los principales sistemas operativos que admiten Java , incluidos Microsoft Windows, Linux y Macos, o las plataformas en la nube. Esto le permite desarrollar aplicaciones en una plataforma y ejecutarlas sin problemas en otra, eliminando la necesidad de cualquier modificación del código.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de archivo compatibles

Aspose.OCR for Python via Java puede funcionar con cualquier archivo Puede obtener de un escáner o cámara. Los resultados de reconocimiento se pueden guardar, importar a una base de datos o analizarse en tiempo real.

Imágenes

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR por lotes

  • Multi-page PDF
  • ZIP
  • Folder

Resultados de reconocimiento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalación sin esfuerzo para Python a través de Java

Aspose.OCR para Python a través de Java se entrega como un paquete de Python o como un archivo descargable con dependencias mínimas. Fácilmente instalar en su proyecto, y está listo para reconocer los textos en múltiples idiomas compatibles y guardar resultados de reconocimiento en varios formatos.

Solicite una licencia de prueba para iniciar el desarrollo de una aplicación OCR totalmente funcional sin limitaciones.

Potente OCR para aplicaciones de Python

Nuestra biblioteca se integra fácilmente, permitiendo que las aplicaciones de Python se ejecuten perfectamente en cualquier plataforma: Windows de escritorio, Windows Server, MacOS, Linux y la nube.

140+ lenguajes de reconocimiento

Nuestra API de Python y Java OCR reconoce una gran cantidad de idiomas y guiones de escritura populares, incluidos idiomas mixtos:

Deje la detección del idioma en la biblioteca o defina el idioma usted mismo para su mayor rendimiento y confiabilidad de reconocimiento.

  • ** Latín extendido ** Alfabeto: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 más;
  • ** Cirílico ** Alfabeto: ruso, ucraniano, kazajos, serbio, bielorrusa, búlgaro;
  • Árabe, persa, urdu;
  • Guión chino y Devanagari, incluidos hindi, marathi, bhojpuri y otros.

Filtros de procesamiento de imágenes mejorados

La precisión del reconocimiento de caracteres ópticos se basa en gran medida en la calidad de la imagen original. Aspose.OCR para Python a través de Java ofrece una amplia gama de filtros de procesamiento de imágenes automatizados y manuales para optimizar una imagen antes de enviar al motor OCR:

  • Enderezar automáticamente las imágenes ligeramente inclinadas.
  • Corrija manualmente la rotación de imágenes severamente sesgadas.
  • Retire automáticamente la suciedad, las manchas, los rasguños, el resplandor, los gradientes no deseados y otros tipos de ruido.
  • Ajuste automáticamente el contraste de la imagen.
  • Automáticamente compensación o cambiar el tamaño manual de la imagen.
  • Convierta las imágenes en blanco y negro o escala de grises.
  • Invertir los colores de la imagen, hacer que las áreas claras parezcan áreas oscuras y oscuras parecen claras.
  • Aumente el grosor de los caracteres en una imagen.
  • Desduza las imágenes ruidosas mientras preserva los bordes de las letras.
  • Enderezar la sesgo de página y corregir la distorsión de la lente de la cámara en las fotos de la página.

API especilizadas para varios tipos de documentos

Aspose.OCR para Python a través de Java ofrece redes neuronales especialmente capacitadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:

  • Tarjetas de identificación escaneadas o fotografiadas.
  • Placas de licencia de vehículos.
  • Facturas.
  • Ingresos.

Corrector ortográfico incorporado

Aunque Aspose.OCR para Python a través de Java proporciona una alta precisión de reconocimiento, la impresión de defectos, la suciedad o las fuentes no estándar pueden hacer que ciertos caracteres o palabras sean reconocidos incorrectamente. Para mejorar aún más los resultados de reconocimiento, puede activar el corrector ortográfico, que encuentra y corrige automáticamente los errores de ortografía en función del lenguaje de reconocimiento seleccionado.

Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios de ortografía comunes, puede proporcionar sus propias listas de palabras.

Reconocimiento de lotes eficiente

Nuestra API de Python OCR te permite agilizar el reconocimiento de imágenes. Utilice métodos versátiles de procesamiento por lotes para un procesamiento eficiente de múltiples imágenes en una sola llamada:

  • Reconocer archivos PDF, TIFF de varias páginas.
  • Procese todos los archivos dentro de una carpeta.
  • Manejar el reconocimiento de todos los archivos en un archivo.
  • Reconocer imágenes de una lista especificada.

Aprendiendo a través de ejemplos de python

Explore una variedad de Ejemplos de Python diseñado para ayudarlo a comprender rápidamente las funciones y capacidades de nuestra solución OCR. Obtenga rápidamente información sobre la creación de soluciones personalizadas que cumplan con sus requisitos comerciales específicos.

Características y capacidades

Aspose.OCR for Python via Java Explore las características avanzadas de Aspose.OCR para Python

Feature icon

Foto OCR

Extraiga el texto de las fotos del teléfono inteligente con precisión de nivel de escaneo.

Feature icon

PDF de búsqueda

Convierta cualquier escaneo en un documento totalmente de búsqueda e indexable.

Feature icon

Reconocimiento de URL

Reconocer una imagen de URL sin descargarla localmente.

Feature icon

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Feature icon

Cualquier fuente y estilo

Identificar y reconocer el texto en todos los tipos de letra y estilos populares.

Feature icon

Reconocimiento de afinidad

Ajuste cada parámetro OCR para obtener mejores resultados de reconocimiento.

Feature icon

Corrector ortográfico

Mejorar los resultados corrigiendo automáticamente las palabras mal escritas.

Feature icon

Encuentra texto en las imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Feature icon

Comparar textos de imagen

Compare textos en dos imágenes, independientemente del caso y el diseño.

Muestras de código de python

Descubra muestras de código para integrar a la perfección Aspose.OCR para Python a través de Java en sus aplicaciones.

Instalación sin esfuerzo

Como un paquete de Python o un archivo descargable con dependencias mínimas, Aspose.OCR para Python a través de Java garantiza una distribución fácil. Integrarlo en su proyecto directamente desde Python, y está preparado para aprovechar las capacidades de OCR completas, ahorrando los resultados de reconocimiento en varios formatos.

después de la instalación, comienza rápidamente usando Aspose.OCR para Python a través de Java, aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR totalmente funcional, lo que le permite tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de Java más tarde.

Licencia de carga

lic = License()
lic.set_license(self.licPath)

Reconocimiento de imágenes

El desafío principal en las aplicaciones OCR es la escasez de escáneres para los usuarios finales. Nuestra API, integrada sin problemas con Python a través de Java, presenta filtros de preprocesamiento de imágenes incorporados robustos que manejan imágenes rotadas, sesgadas y ruidosas. Combinado con soporte para todos los formatos de imagen, permite un reconocimiento confiable, incluso de las fotos de teléfonos inteligentes. La mayoría de los procesos previos y la corrección de imágenes están automatizadas, lo que requiere su intervención solo en casos desafiantes.

Aplicar correcciones automáticas de imágenes - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Nuestra API lee con expertos cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, JPEG, PNG, TIFF, GIF, archivos BMP. El soporte completo para documentos PDF de varias páginas, TIFF e imágenes DJVU garantiza la versatilidad. También puede proporcionar una imagen desde la web a través de una URL.

Los resultados de reconocimiento se devuelven en formatos populares de documentos y intercambio de datos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.

Reconocer PDF y guardar resultados en varios formatos de salida - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimización del uso de recursos

OCR ofrece un algoritmo de reconocimiento especial para extraer contenido de imágenes con texto escaso y fondos ruidosos/de colores. Este método mejora significativamente la precisión de OCR en los siguientes casos comerciales:

  • Lea el texto de las fotos de la calle.
  • Segmento e identificar letreros y letreros de carretera dentro de las imágenes de la calle.
  • Localice las etiquetas de precios e interprete el texto extraído como precios.
  • Encuentre y agregue regiones de interés en las etiquetas de los alimentos, como información nutricional o listas de ingredientes.
  • Identificar y analizar placas de automóviles.
  • Extraer texto de menús y catálogos.

Área abierta OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extraer texto de las fotos de la calle

OCR para Python ofrece un algoritmo de reconocimiento especial que extrae texto de placas de vehículos, incluidas fotos oscuras y borrosas. El texto resultante se puede guardar automáticamente en la base de datos o verificar automáticamente.

Reconocer el número de automóvil - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)