¿Por qué elegir la biblioteca Aspose OCR para Java?

Desbloquee potente OCR con la biblioteca Aspose OCR Java. Nuestra API Java es una API OCR de OCR eficiente, fácil de usar y rentable. En solo cinco líneas de código Java, agregue una funcionalidad OCR potente a sus aplicaciones sin necesidad de comprender las redes neuronales y otros detalles técnicos.

Nuestro motor OCR proporciona velocidad y precisión inigualables, que respalda más de 140 idiomas, incluidos inglés, cirílicos, árabes, perseguidos, chinos, japoneses, coreanos, hindi, tamil y muchos más. Ya sea que trabaje con escaneos, fotos de teléfonos inteligentes, capturas de pantalla o PDF, nuestro texto de extractos de OCR y genera resultados en todos los formatos populares.
El preprocesamiento de imágenes corrige automáticamente las imágenes rotadas, borrosas, invertidas e ruidosas para garantizar la precisión más alta de reconocimiento en cualquier condición.

Illustration ocr

OCR rápido y preciso

Lograr resultados de OCR de alta velocidad y precisos con nuestra tecnología Java avanzada.

Soporte multilingüe

Reconocer el texto en más de 140 idiomas, incluidos inglés, francés, cirílico, árabe, persa, indic, chino, japonés, coreano, tamil y otros guiones.

Todas las imágenes

Procese imágenes de varias fuentes, como escáneres, cámaras y teléfonos inteligentes.

Detección de idiomas mixtos

Reconocer documentos escritos en idiomas mixtos, como chino/inglés, árabe/francés, hindi/inglés e cirílico/inglés.

Cualquier fuente, estilo y formato

Preservar con precisión el diseño del texto, detectar la estructura de la tabla y reconocer a la perfección el texto independientemente de los estilos de fuente.

Muestra de código en vivo

Experimente la simplicidad: transforma la imagen en texto en pocas líneas de código Java

Listo para reconocer Listo para reconocer Deje caer un archivo aquí o haga clic para navegar *

* Al cargar sus archivos o utilizando el servicio que acepta con nuestro Condiciones de uso y política de privacidad.

Resultado de reconocimiento
 

Convertir la imagen en texto

Explore más ejemplos >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Multiplataforma

El código de Aspose Java OCR funciona sin problemas en cualquier plataforma que admite Java SE 6.0 o superior , ya sea una máquina local, un servidor web o la nube.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Formatos de archivo compatibles

Aspose.OCR for Java puede funcionar con cualquier archivo Puede obtener de un escáner o cámara. Los resultados de reconocimiento se pueden guardar, importar a una base de datos o analizarse en tiempo real.

Imágenes

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

OCR por lotes

  • Multi-page PDF
  • ZIP
  • Folder

Resultados de reconocimiento

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Instalación fácil

Aspose.OCR para Java se distribuye como un archivo Java Archive (JAR) ligero o como un archivo descargable con dependencias mínimas. Simplemente instalar en su proyecto, y está listo para reconocer los textos en múltiples idiomas compatibles y guardar resultados de reconocimiento en varios formatos.

Solicite una licencia de prueba para iniciar el desarrollo de una aplicación OCR totalmente funcional sin limitaciones.

Funciona en todas partes

Nuestra biblioteca Java es compatible con Java SE 6 o superior, lo que permite que sus aplicaciones se ejecuten perfectamente en cualquier plataforma: Desktop Windows, Windows Server, MacOS, Linux y la nube.

140+ lenguajes de reconocimiento

Nuestra biblioteca Java OCR es una solución universal para el procesamiento de documentos, la extracción de datos y la digitalización de contenido a escala global. Con el apoyo a una amplia gama de guiones de escritura europeos, del Medio Oriente y Asia, está bien adaptado para cualquier país y negocio.

El aspose OCR para Java reconoce el texto en documentos multilingües, como chino/inglés, árabe/francés o cirílico/inglés. Se admiten los siguientes idiomas:

  • ** Latín extendido **: inglés, español, francés, indonesio, portugués, alemán, vietnamita, turco, italiano, polaco y más de 80 más;
  • ** Cirílico ** Alfabeto: ruso, ucraniano, kazajro, búlgaro, incluidos textos de cirílicos/ingleses mixtos;
  • Árabe, persa, urdu, incluidos textos mezclados con inglés;
  • Idiomas chinos, coreanos, japoneses, devanagari y dravidianos, incluidos hindi, tamil, marathi y otros.

Características y capacidades

Aspose.OCR for Java Explore las características y capacidades avanzadas de Aspose OCR para Java.

Feature icon

Foto OCR

Extraiga el texto de las fotos del teléfono inteligente con precisión de nivel de escaneo.

Feature icon

PDF de búsqueda

Convierta cualquier exploración en un documento de búsqueda y editable.

Feature icon

Reconocimiento de URL

Reconocer una imagen de URL sin descargarla localmente.

Feature icon

Reconocimiento masivo

Lea todas las imágenes de documentos, carpetas y archivos de varias páginas.

Feature icon

Cualquier fuente y estilo

Identificar y reconocer el texto en todos los tipos de letra y estilos populares.

Feature icon

Reconocimiento de afinidad

Ajuste cada parámetro OCR para obtener mejores resultados de reconocimiento.

Feature icon

Corrector ortográfico

Mejorar los resultados corrigiendo automáticamente las palabras mal escritas.

Feature icon

Encuentra texto en las imágenes

Busque texto o expresión regular dentro de un conjunto de imágenes.

Feature icon

Comparar textos de imagen

Compare textos en dos imágenes, independientemente del caso y el diseño.

Feature icon

Mundial

Extraiga texto de cualquier idioma con detección automática del lenguaje.

Feature icon

Extracción de detalles clave

Extraiga automáticamente detalles importantes de las tarjetas de identificación.

Feature icon

Integración completa con soluciones de aspose

Integre OCR a la perfección con otros productos de asposición para una solución Java integral y eficiente.

Muestras de código

Explore las muestras de código para aprender cómo integrar a la API de OCR sin problemas en sus aplicaciones Java.

Instalación

Como un archivo Java Archive (JAR) con dependencias mínimas o del repositorio de Maven, el OCR de Aspose para Java se distribuye fácilmente. La integración en su proyecto, directamente desde su entorno de desarrollo integrado (IDE) preferido Java, es un proceso perfecto. Simplemente instálelo y esté preparado para aprovechar el rango completo de capacidades de OCR, ahorrando los resultados de reconocimiento en cualquiera de los formatos compatibles.

Post-Installation, puede comenzar de inmediato a usar Aspose.OMR para Java, aunque con ciertas limitaciones. Una licencia temporal eleva todas las restricciones de la versión de prueba durante 30 días. Utilice este período para iniciar el desarrollo de una aplicación OCR completamente funcional, lo que le permite tomar una decisión informada sobre la compra de Aspose.OCR para Java en una etapa posterior.

Reconocer texto sobre imágenes escaneadas en Java

Superar el desafío de las aplicaciones OCR que carecen de escáneres generalizados. Nuestra API cuenta con poderosos filtros de preprocesamiento de imágenes incorporadas que manejan hábilmente imágenes rotadas, sesgadas y ruidosas. Combinado con el soporte para todos los formatos de imagen, garantiza un reconocimiento confiable incluso de las fotos de teléfonos inteligentes. La mayoría de los procesos previos y la corrección de imágenes están automatizadas, lo que requiere su intervención solo en casos desafiantes.

Aplicar correcciones automáticas de imágenes - Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

Extraer texto de fotos en java

Integre la detección y el reconocimiento de texto en sus aplicaciones Java. Acceda a los resultados precisos de las fotos con facilidad, mejorando sus capacidades de procesamiento de imágenes. Eleve las capacidades de procesamiento de imágenes, obteniendo resultados precisos de las fotos.

Detectar y reconocer el texto en la foto - Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Optimización de recursos en Java

El reconocimiento de caracteres ópticos exige recursos. Nuestra API ofrece formas flexibles de equilibrar la tríada clásica de calidad de tiempo. Le permite restringir el número de subprocesos utilizados por el motor de reconocimiento. Si bien este ajuste puede conducir a una velocidad de reconocimiento más lenta, le permite asignar recursos para tareas concurrentes como procesamiento de imágenes paralelas, operaciones de servidor web, gestión de bases de datos o análisis de datos de fondo.

  • Elija entre reconocimiento exhaustivo y reconocimiento rápido.
  • Especifique el número de subprocesos asignados para el reconocimiento, o permita que la biblioteca escala automáticamente al número de núcleos de procesador.
  • Libere la CPU descargando cálculos a la GPU.

Balancio de recursos uasage

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

Reconocimiento rápido con una configuración mínima

Si sus imágenes son escaneos de alta calidad sin sesgo o distorsión, puede usar el modo de reconocimiento más rápido que consume recursos mínimos posibles utilizando:

Reconocimiento rápido OCR - Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});