¿Por qué Aspose.OCR para Python a través de Java?

Aspose.OCR para Python a través de Java integra a la perfección potentes capacidades de reconocimiento óptico de caracteres (OCR) en sus aplicaciones y cuadernos Python multiplataforma. Con nuestra API intuitiva y de alta velocidad, puede extraer sin esfuerzo texto de escaneos, capturas de pantalla, enlaces web o fotografías de teléfonos inteligentes, entregando resultados que están listos para su consolidación, análisis o almacenamiento. Reconozca imágenes escaneadas, fotografías de teléfonos inteligentes, capturas de pantalla y archivos PDF escaneados, guardando los resultados en formatos de documentos populares. Los filtros de preprocesamiento avanzados manejan imágenes rotadas, sesgadas y ruidosas. Optimice el rendimiento descargando tareas a la GPU.

Illustration ocr

OCR rápido y preciso

Logre resultados de OCR precisos y de alta velocidad con nuestra avanzada tecnología Python a través de Java.

Soporte multilingüe

Reconozca texto en 28 idiomas, incluidos alfabetos latinos, cirílicos y chinos, lo que garantiza versatilidad para sus aplicaciones Python a través de Java.

Soporte de imagen flexible

Procese imágenes de escáneres, cámaras y teléfonos inteligentes sin problemas con Python a través de Java.

Precisión en el reconocimiento de caracteres chinos

Reconozca más de 6000 caracteres chinos con precisión en sus proyectos Python a través de Java.

Conservar estilos de fuente y formato

Mantenga los estilos de fuente y el formato para una representación precisa del texto reconocido en sus aplicaciones Python a través de Java.

Ejemplo de código en vivo

Inicie el reconocimiento de texto a partir de imágenes en solo tres líneas de código. ¡Experimente la simplicidad!

Listo para reconocer Listo para reconocer Suelta un archivo aquí o haz clic para explorar *

* Al cargar tus archivos o utilizar el servicio, estás de acuerdo con nuestra Condiciones de uso y política de privacidad.

Resultado del reconocimiento
 

Convertir imagen a texto

Más ejemplos >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Compatibilidad con el backend de Java

Diseñada como un módulo de Python, nuestra biblioteca garantiza la compatibilidad con los principales sistemas operativos que admiten Java , incluidos Microsoft Windows, Linux y macOS, o el plataformas en la nube. Esto le permite desarrollar aplicaciones en una plataforma y ejecutarlas sin problemas en otra, eliminando la necesidad de realizar modificaciones en el código.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de archivo admitidos

Aspose.OCR for Python via Java puede trabajar con prácticamente cualquier archivo puede obtenerlo de un escáner o una cámara. Los resultados del reconocimiento se devuelven en los formatos de intercambio de datos y archivos más populares que se pueden guardar, importar a una base de datos o analizar en tiempo real.

Imágenes

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR por lotes

  • Multi-page PDF
  • ZIP
  • Folder

Resultados del reconocimiento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalación sencilla de Python a través de Java

Aspose.OCR para Python a través de Java se entrega como un paquete de Python o como un archivo descargable con dependencias mínimas. Instálelo fácilmente en su proyecto y estará listo para reconocer textos en varios idiomas admitidos y guardar los resultados del reconocimiento en varios formatos.

Solicite una licencia de prueba para iniciar el desarrollo de una aplicación de OCR completamente funcional y sin limitaciones.

Potente OCR para aplicaciones Python

Nuestra biblioteca se integra fácilmente, lo que permite que las aplicaciones Python se ejecuten sin problemas en cualquier plataforma: Windows de escritorio, Windows Server, macOS, Linux y la nube.

28 idiomas de reconocimiento

Nuestra API de OCR de Python y Java reconoce una gran cantidad de lenguajes y scripts de escritura populares, incluidos lenguajes mixtos:

Deje la detección de idioma en manos de la biblioteca o defina el idioma usted mismo para mejorar el rendimiento y la confiabilidad del reconocimiento.

  • Alfabeto latino extendido: alemán, croata, checo, danés, holandés, inglés, estonio, finlandés, francés, alemán, italiano, letón, lituano, noruego, polaco, portugués, rumano, eslovaco, esloveno, español, sueco;
  • Alfabeto cirílico: bielorruso, búlgaro, kazajo, ruso, serbio, ucraniano;
  • Chino: más de 6000 caracteres;
  • Hindi.

Filtros de procesamiento de imágenes mejorados

La precisión del reconocimiento óptico de caracteres depende en gran medida de la calidad de la imagen original. Aspose.OCR para Python a través de Java ofrece una amplia gama de filtros de procesamiento de imágenes manuales y automatizados para optimizar una imagen antes de enviarla al motor de OCR:

  • Enderece automáticamente imágenes ligeramente inclinadas.
  • Corrija manualmente la rotación de imágenes muy sesgadas.
  • Elimina automáticamente suciedad, manchas, rayones, reflejos, gradientes no deseados y otros tipos de ruido.
  • Ajusta automáticamente el contraste de la imagen.
  • Mejora automáticamente o cambia el tamaño de la imagen manualmente.
  • Convierte imágenes a blanco y negro o escala de grises.
  • Invierta los colores de la imagen, haciendo que las áreas claras parezcan oscuras y las áreas oscuras parezcan claras.
  • Aumenta el grosor de los caracteres de una imagen.
  • Desenfoque las imágenes ruidosas conservando los bordes de las letras.
  • Enderezar la inclinación de la página y corregir la distorsión de la lente de la cámara en las fotografías de la página.

API especializadas para varios tipos de documentos

Aspose.OCR para Python vía Java ofrece redes neuronales especialmente entrenadas para extraer texto de ciertos tipos de imágenes con la máxima precisión:

  • DNI y pasaportes escaneados o fotografiados.
  • Matrículas de vehículos.
  • Facturas.
  • Ingresos.

Corrector ortográfico incorporado

Aunque Aspose.OCR para Python a través de Java proporciona una alta precisión de reconocimiento, los defectos de impresión, la suciedad o las fuentes no estándar pueden provocar que ciertos caracteres o palabras se reconozcan incorrectamente. Para mejorar aún más los resultados del reconocimiento, puede activar el corrector ortográfico, que busca y corrige automáticamente los errores ortográficos según el idioma de reconocimiento seleccionado.

Si el texto reconocido contiene terminología especializada, abreviaturas y otras palabras que no están presentes en los diccionarios ortográficos comunes, puede proporcionar sus propias listas de palabras.

Reconocimiento de lotes eficiente

Nuestra API Python OCR le permite optimizar el reconocimiento de imágenes. Utilice métodos versátiles de procesamiento por lotes para un procesamiento eficiente de múltiples imágenes en una sola llamada:

  • Reconocer archivos PDF y TIFF de varias páginas.
  • Procese todos los archivos dentro de una carpeta.
  • Manejar el reconocimiento de todos los archivos en un archivo.
  • Reconocer imágenes de una lista específica.

Aprendizaje a través de ejemplos de Python

Explore una variedad de ejemplos de Python diseñados para ayudarlo a comprender rápidamente las funciones y capacidades de nuestra solución OCR. Obtenga rápidamente información sobre cómo crear soluciones personalizadas que satisfagan sus requisitos comerciales específicos.

Características y capacidades

Aspose.OCR for Python via Java Explore las funciones avanzadas de Aspose.OCR para Python

Feature icon

OCR de fotos

Extraiga texto de fotografías de teléfonos inteligentes con precisión a nivel de escaneo.

Feature icon

PDF con capacidad de búsqueda

Convierta cualquier escaneo en un documento indexable y con capacidad de búsqueda completa.

Feature icon

reconocimiento de URL

Reconocer una imagen desde la URL sin descargarla localmente.

Feature icon

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Feature icon

Cualquier fuente y estilo

Identifique y reconozca texto en todos los tipos de letra y estilos populares.

Feature icon

Reconocimiento preciso

Ajuste todos los parámetros de OCR para obtener mejores resultados de reconocimiento.

Feature icon

Corrector ortográfico

Mejore los resultados corrigiendo automáticamente las palabras mal escritas.

Feature icon

Buscar texto en imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Feature icon

Comparar textos de imágenes

Compare textos en dos imágenes, independientemente del caso y el diseño.

Ejemplos de código Python

Descubra ejemplos de código para integrar perfectamente Aspose.OCR para Python a través de Java en sus aplicaciones.

Instalación sin esfuerzo

Como paquete de Python o archivo descargable con dependencias mínimas, Aspose.OCR para Python a través de Java garantiza una fácil distribución. Intégrelo en su proyecto directamente desde Python y estará preparado para aprovechar las capacidades completas de OCR, guardando los resultados del reconocimiento en varios formatos.

Después de la instalación, comience inmediatamente a usar Aspose.OCR para Python a través de Java. aunque con ciertas limitaciones. Una licencia temporal elimina todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR completamente funcional, lo que le permitirá tomar una decisión informada sobre la compra de Aspose.OCR para Python a través de Java más adelante.

Cargar licencia

lic = License()
lic.set_license(self.licPath)

Reconocimiento de imagen

El principal desafío de las aplicaciones de OCR es la escasez de escáneres para los usuarios finales. Nuestra API, perfectamente integrada con Python a través de Java, presenta robustos filtros de preprocesamiento de imágenes integrados que manejan imágenes rotadas, sesgadas y ruidosas. Combinado con la compatibilidad con todos los formatos de imagen, permite un reconocimiento fiable, incluso a partir de fotografías de teléfonos inteligentes. La mayoría del preprocesamiento y corrección de imágenes están automatizados y requieren su intervención solo en casos difíciles.

Aplicar correcciones automáticas de imágenes - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Convertidor universal de Python

Nuestra API lee hábilmente cualquier imagen de escáneres, cámaras o teléfonos inteligentes: documentos PDF, archivos JPEG, PNG, TIFF, GIF, BMP. La compatibilidad total con documentos PDF de varias páginas, TIFF e imágenes DjVu garantiza la versatilidad. También puedes proporcionar una imagen de la web a través de una URL.

Los resultados del reconocimiento se devuelven en formatos populares de intercambio de datos y documentos: texto sin formato, PDF, Microsoft Word, Microsoft Excel, JSON y XML.

Reconocer PDF y guardar resultados en varios formatos de salida - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimización del uso de recursos

OCR ofrece un algoritmo de reconocimiento especial para extraer contenido de imágenes con texto escaso y fondos ruidosos o coloreados. Este método mejora significativamente la precisión del OCR en los siguientes casos comerciales:

  • Leer texto de fotografías de la calle.
  • Segmente e identifique señales de tráfico y letreros dentro de imágenes de calles.
  • Localice etiquetas de precios e interprete el texto extraído como precios.
  • Encuentre y agregue regiones de interés en las etiquetas de los alimentos, como información nutricional o listas de ingredientes.
  • Identificar y analizar matrículas de automóviles.
  • Extraiga texto de menús y catálogos.

OCR de área abierta - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extraer texto de fotos de calles

OCR para Python ofrece un algoritmo de reconocimiento especial que extrae texto de las matrículas de los vehículos, incluidas fotografías oscuras y borrosas. El texto resultante se puede guardar automáticamente en la base de datos o verificar automáticamente.

Reconocer el número de coche - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)