procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato TIFF y crea documentos TIFF que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita obtener Aspose.OCR
Maven o especifique la configuración del Repositorio Aspose Maven e instálelo dentro de su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml. Para ver ejemplos de Graddle, Ivy, Sbt, consulte nuestro [repositorio] ( https://repository.aspose.com/ocr/ ) .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Con Java OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen TIFF en un documento Searchable PDF:
- Crear una instancia de la clase AsposeOcr
- Llamar al método AsposeOCR.RecognizePage
- Pase la ruta del archivo TIFF como parámetro
- AsposeOCR.RecognizePage devuelve una cadena o archivo de tipo Searchable PDF
Requisitos del sistema
Antes de ejecutar el ejemplo, asegúrese de que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o posterior esté instalado en su sistema.
- Está instalado JDK 1.6 o superior.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
TIFF Que es TIFF Formato de archivo
TIFF o TIF, formato de archivo de imagen etiquetada, representa imágenes de trama diseñadas para su uso en una variedad de dispositivos que cumplen con este estándar de formato de archivo. Es capaz de describir datos de imágenes de dos niveles, escala de grises, colores de paleta y a todo color en varios espacios de color. Admite esquemas de compresión con pérdida y sin pérdida para elegir entre el espacio y el tiempo para las aplicaciones que utilizan el formato. El formato es extensible y ha sufrido varias revisiones que permiten la inclusión de una cantidad ilimitada de información privada o de propósito especial. El formato no depende de la máquina y está libre de límites como el procesador, el sistema operativo o los sistemas de archivos.
Lee masSearchable PDF Que es Searchable PDF Formato de archivo
Los archivos PDF que admiten búsquedas conservan la imagen escaneada original para su visualización, así como el texto OCR en una capa oculta que se puede utilizar para búsquedas de texto completo dentro de un documento o para resaltar texto para operaciones de copiar y pegar. La conversión completa de OCR a PDF, sin incluir la imagen original, nunca conservará el 100 % del formato original, especialmente si el documento tiene muchas imágenes o un diseño complejo.
Lee mas