OCR for Java

OCR for C++

OCR for Python via .NET

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via Java

Convertir la imagen en texto con Python OCR API a través de Java

Desbloquee el poder de OCR en Python utilizando nuestro aspositivo rico en características para Python a través de la biblioteca Java. Convierta imágenes y PDF en texto editable sin esfuerzo.

Descargar Ensayo Compra

Mira lo nuevo

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-java or
download

¿Por qué aspirar.ocr por Python a través de Java?

Aspose.OCR para Python a través de Java integra perfectamente las potentes capacidades de reconocimiento de caracteres ópticos (OCR) en sus cuadernos y aplicaciones de Python multiplataforma. Con nuestra API intuitiva y de alta velocidad, puede extraer texto sin esfuerzo de escaneos, capturas de pantalla, enlaces web o fotos de teléfonos inteligentes, entregando resultados listos para la consolidación, análisis o almacenamiento. Reconocer imágenes escaneadas, fotos de teléfonos inteligentes, capturas de pantalla y PDF escaneados, guardando resultados en formatos de documentos populares. Los filtros de preprocesamiento avanzado manejan imágenes rotadas, sesgadas y ruidosas. Optimizar el rendimiento descargando tareas a la GPU.

OCR rápido y preciso

Lograr resultados de OCR de alta velocidad y precisos con nuestra Python avanzada a través de la tecnología Java.

Soporte multilingüe

Reconocer el texto en más de 140 idiomas, incluidos los guiones latinos, cirílicos, árabes, persa, indic y chinos, asegurando la versatilidad para sus aplicaciones de Python a través de Java.

Soporte de imagen flexible

Procese imágenes de escáneres, cámaras y teléfonos inteligentes sin problemas con Python a través de Java.

Precisión en el reconocimiento de personajes chinos

Reconozca más de 6,000 caracteres chinos con precisión en sus proyectos de Python a través de Java.

Preservar estilos de fuente y formato

Mantenga estilos de fuente y formateo para una representación precisa del texto reconocido en sus aplicaciones de Python a través de Java.

Muestra de código en vivo

Inicie el reconocimiento de texto desde las imágenes en solo tres líneas de código. ¡Experimenta la simplicidad!

Listo para reconocer Listo para reconocer Deje caer un archivo aquí o haga clic para navegar *

* Al cargar sus archivos o utilizando el servicio que acepta con nuestro Condiciones de uso y política de privacidad.

Resultado de reconocimiento

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Elige tu preferencia

Elija la biblioteca adecuada para sus necesidades. Explore las API disponibles y sus capacidades para seleccionar la solución más eficiente.

Python via .NET

Desarrollo fácil, legibilidad y mantenimiento del código

Cuenta con la mayoría de las funciones y recibe las actualizaciones más frecuentes

La velocidad general puede ser un poco más lenta que otras plataformas

Python via Java

Use la misma biblioteca en cualquier plataforma

Ejecute sin problemas su aplicación en cualquier dispositivo

Requiere la versión 8 o posterior de Java Runtime Environment (JRE)

Python via C++

La velocidad más rápida posible independientemente de la plataforma

Una gran cantidad de control sobre la gestión de recursos

Dirigido a desarrolladores experimentados

Compatibilidad de backend de Java

Diseñado como un módulo de Python, nuestra biblioteca garantiza la compatibilidad entre los principales sistemas operativos que admiten Java , incluidos Microsoft Windows, Linux y Macos, o las plataformas en la nube. Esto le permite desarrollar aplicaciones en una plataforma y ejecutarlas sin problemas en otra, eliminando la necesidad de cualquier modificación del código.

Formatos de archivo compatibles

Aspose.OCR for Python via Java puede funcionar con cualquier archivo Puede obtener de un escáner o cámara. Los resultados de reconocimiento se pueden guardar, importar a una base de datos o analizarse en tiempo real.

Imágenes

PDF
JPEG
PNG
TIFF
GIF
Bitmap

OCR por lotes

Multi-page PDF
ZIP
Folder

Resultados de reconocimiento

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

Instalación sin esfuerzo para Python a través de Java

Aspose.OCR para Python a través de Java se entrega como un paquete de Python o como un archivo descargable con dependencias mínimas. Fácilmente instalar en su proyecto, y está listo para reconocer los textos en múltiples idiomas compatibles y guardar resultados de reconocimiento en varios formatos.

Solicite una licencia de prueba para iniciar el desarrollo de una aplicación OCR totalmente funcional sin limitaciones.

Potente OCR para aplicaciones de Python

Nuestra biblioteca se integra fácilmente, permitiendo que las aplicaciones de Python se ejecuten perfectamente en cualquier plataforma: Windows de escritorio, Windows Server, MacOS, Linux y la nube.

140+ lenguajes de reconocimiento

Nuestra API de Python y Java OCR reconoce una gran cantidad de idiomas y guiones de escritura populares, incluidos idiomas mixtos:

Deje la detección del idioma en la biblioteca o defina el idioma usted mismo para su mayor rendimiento y confiabilidad de reconocimiento.

** Latín extendido ** Alfabeto: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 más;
** Cirílico ** Alfabeto: ruso, ucraniano, kazajos, serbio, bielorrusa, búlgaro;
Árabe, persa, urdu;
Guión chino y Devanagari, incluidos hindi, marathi, bhojpuri y otros.

Filtros de procesamiento de imágenes mejorados

La precisión del reconocimiento de caracteres ópticos se basa en gran medida en la calidad de la imagen original. Aspose.OCR para Python a través de Java ofrece una amplia gama de filtros de procesamiento de imágenes automatizados y manuales para optimizar una imagen antes de enviar al motor OCR:

Enderezar automáticamente las imágenes ligeramente inclinadas.
Corrija manualmente la rotación de imágenes severamente sesgadas.
Retire automáticamente la suciedad, las manchas, los rasguños, el resplandor, los gradientes no deseados y otros tipos de ruido.
Ajuste automáticamente el contraste de la imagen.
Automáticamente compensación o cambiar el tamaño manual de la imagen.
Convierta las imágenes en blanco y negro o escala de grises.
Invertir los colores de la imagen, hacer que las áreas claras parezcan áreas oscuras y oscuras parecen claras.
Aumente el grosor de los caracteres en una imagen.
Desduza las imágenes ruidosas mientras preserva los bordes de las letras.
Enderezar la sesgo de página y corregir la distorsión de la lente de la cámara en las fotos de la página.

API especilizadas para varios tipos de documentos

Aspose.OCR para Python a través de Java ofrece redes neuronales especialmente capacitadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:

Tarjetas de identificación escaneadas o fotografiadas.
Placas de licencia de vehículos.
Facturas.
Ingresos.

Corrector ortográfico incorporado

Aunque Aspose.OCR para Python a través de Java proporciona una alta precisión de reconocimiento, la impresión de defectos, la suciedad o las fuentes no estándar pueden hacer que ciertos caracteres o palabras sean reconocidos incorrectamente. Para mejorar aún más los resultados de reconocimiento, puede activar el corrector ortográfico, que encuentra y corrige automáticamente los errores de ortografía en función del lenguaje de reconocimiento seleccionado.

Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios de ortografía comunes, puede proporcionar sus propias listas de palabras.

Reconocimiento de lotes eficiente

Nuestra API de Python OCR te permite agilizar el reconocimiento de imágenes. Utilice métodos versátiles de procesamiento por lotes para un procesamiento eficiente de múltiples imágenes en una sola llamada:

Reconocer archivos PDF, TIFF de varias páginas.
Procese todos los archivos dentro de una carpeta.
Manejar el reconocimiento de todos los archivos en un archivo.
Reconocer imágenes de una lista especificada.

Aprendiendo a través de ejemplos de python

Explore una variedad de Ejemplos de Python diseñado para ayudarlo a comprender rápidamente las funciones y capacidades de nuestra solución OCR. Obtenga rápidamente información sobre la creación de soluciones personalizadas que cumplan con sus requisitos comerciales específicos.

Características y capacidades

Aspose.OCR for Python via Java Explore las características avanzadas de Aspose.OCR para Python

Foto OCR

Extraiga el texto de las fotos del teléfono inteligente con precisión de nivel de escaneo.

PDF de búsqueda

Convierta cualquier escaneo en un documento totalmente de búsqueda e indexable.

Reconocimiento de URL

Reconocer una imagen de URL sin descargarla localmente.

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Cualquier fuente y estilo

Identificar y reconocer el texto en todos los tipos de letra y estilos populares.

Reconocimiento de afinidad

Ajuste cada parámetro OCR para obtener mejores resultados de reconocimiento.

Corrector ortográfico

Mejorar los resultados corrigiendo automáticamente las palabras mal escritas.

Encuentra texto en las imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Comparar textos de imagen

Compare textos en dos imágenes, independientemente del caso y el diseño.

Muestras de código de python

Descubra muestras de código para integrar a la perfección Aspose.OCR para Python a través de Java en sus aplicaciones.

Instalación sin esfuerzo

Como un paquete de Python o un archivo descargable con dependencias mínimas, Aspose.OCR para Python a través de Java garantiza una distribución fácil. Integrarlo en su proyecto directamente desde Python, y está preparado para aprovechar las capacidades de OCR completas, ahorrando los resultados de reconocimiento en varios formatos.

después de la instalación, comienza rápidamente usando Aspose.OCR para Python a través de Java, aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR totalmente funcional, lo que le permite tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de Java más tarde.

Licencia de carga

lic = License()
lic.set_license(self.licPath)

Reconocimiento de imágenes

El desafío principal en las aplicaciones OCR es la escasez de escáneres para los usuarios finales. Nuestra API, integrada sin problemas con Python a través de Java, presenta filtros de preprocesamiento de imágenes incorporados robustos que manejan imágenes rotadas, sesgadas y ruidosas. Combinado con soporte para todos los formatos de imagen, permite un reconocimiento confiable, incluso de las fotos de teléfonos inteligentes. La mayoría de los procesos previos y la corrección de imágenes están automatizadas, lo que requiere su intervención solo en casos desafiantes.

Aplicar correcciones automáticas de imágenes - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Nuestra API lee con expertos cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, JPEG, PNG, TIFF, GIF, archivos BMP. El soporte completo para documentos PDF de varias páginas, TIFF e imágenes DJVU garantiza la versatilidad. También puede proporcionar una imagen desde la web a través de una URL.

Los resultados de reconocimiento se devuelven en formatos populares de documentos y intercambio de datos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.

Reconocer PDF y guardar resultados en varios formatos de salida - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimización del uso de recursos

OCR ofrece un algoritmo de reconocimiento especial para extraer contenido de imágenes con texto escaso y fondos ruidosos/de colores. Este método mejora significativamente la precisión de OCR en los siguientes casos comerciales:

Lea el texto de las fotos de la calle.
Segmento e identificar letreros y letreros de carretera dentro de las imágenes de la calle.
Localice las etiquetas de precios e interprete el texto extraído como precios.
Encuentre y agregue regiones de interés en las etiquetas de los alimentos, como información nutricional o listas de ingredientes.
Identificar y analizar placas de automóviles.
Extraer texto de menús y catálogos.

Área abierta OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extraer texto de las fotos de la calle

OCR para Python ofrece un algoritmo de reconocimiento especial que extrae texto de placas de vehículos, incluidas fotos oscuras y borrosas. El texto resultante se puede guardar automáticamente en la base de datos o verificar automáticamente.

Reconocer el número de automóvil - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)