HTML JPG OCR XML BMP
Aspose.OCR  para {plataforma de idioma}
Searchable PDF

Aspose.Imaging para Java

procesa imágenes escaneadas o incluso fotos de teléfonos inteligentes en formato GIF y crea documentos GIF que contienen texto reconocido. Para agregarlo a su proyecto, solo necesita obtener Aspose.OCR

Maven o especifique la configuración del Repositorio Aspose Maven e instálelo dentro de su proyecto basado en Maven agregando las siguientes configuraciones a pom.xml. Para ver ejemplos de Graddle, Ivy, Sbt, consulte nuestro [repositorio] ( https://repository.aspose.com/ocr/ ) .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Con Java OCR y solo unas pocas líneas de código, puede crear una aplicación con todas las funciones que convierte una imagen GIF en un documento Searchable PDF:

  • Crear una instancia de la clase AsposeOcr
  • Llamar al método AsposeOCR.RecognizePage
  • Pase la ruta del archivo GIF como parámetro
  • AsposeOCR.RecognizePage devuelve una cadena o archivo de tipo Searchable PDF

Requisitos del sistema

Antes de ejecutar el ejemplo, asegúrese de que Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o posterior esté instalado en su sistema.

  • Está instalado JDK 1.6 o superior.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • GIF Que es GIF Formato de archivo

    Un GIF o formato de intercambio gráfico es un tipo de imagen altamente comprimida. GIF, propiedad de Unisys, utiliza el algoritmo de compresión LZW que no degrada la calidad de la imagen. Para cada imagen, el GIF generalmente permite hasta 8 bits por píxel y hasta 256 colores en la imagen. A diferencia de una imagen JPEG, que puede mostrar hasta 16 millones de colores y toca bastante los límites del ojo humano. Cuando surgió Internet, los GIF seguían siendo la mejor opción porque requerían un ancho de banda bajo y eran compatibles con los gráficos que consumen áreas sólidas de color. Un GIF animado combina numerosas imágenes o marcos en un solo archivo y los muestra en una secuencia para generar un clip animado o un video corto. Las limitaciones de color son de hasta 256 para cada cuadro y es probable que sean las menos adecuadas para reproducir otras imágenes y fotografías con degradado de color.

    Lee mas

    Searchable PDF Que es Searchable PDF Formato de archivo

    Los archivos PDF que admiten búsquedas conservan la imagen escaneada original para su visualización, así como el texto OCR en una capa oculta que se puede utilizar para búsquedas de texto completo dentro de un documento o para resaltar texto para operaciones de copiar y pegar. La conversión completa de OCR a PDF, sin incluir la imagen original, nunca conservará el 100 % del formato original, especialmente si el documento tiene muchas imágenes o un diseño complejo.

    Lee mas

    TXT (Archivo de documento de texto)
    Text (Archivo de documento de texto)
    DOC (Documentos generados por Microsoft Word)
    DOCX (Documentos de Microsoft Word)
    XLS (Formato de archivo binario de Microsoft Excel)
    XLSX (Documentos de Microsoft Excel)
    PDF (Formato de documento portátil (PDF))
    Searchable PDF (Gráficos de red portátiles con capacidad de búsqueda)
    XML (Lenguaje de marcado extensible)
    JSON (Notación de objetos de JavaScript)