HTML JPG OCR XML BMP
Aspose.OCR  para Java
DOC

Aspose.Imaging for Java

processa imagens digitalizadas ou até mesmo fotos de smartphones no formato GIF e cria documentos GIF contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR

Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Com Java OCR e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem GIF em um documento DOC:

  • Crie uma instância da classe AsposeOcr
  • Chamar o método AsposeOCR.RecognizePage
  • Passe o caminho do arquivo GIF como parâmetro
  • AsposeOCR.RecognizePage retorna uma String ou arquivo do tipo DOC

Requisitos de sistema

Antes de executar o exemplo, certifique-se de que o Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou posterior esteja instalado em seu sistema.

  • JDK 1.6 ou superior está instalado.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • GIF O que é GIF Formato de arquivo

    Um GIF ou Graphical Interchange Format é um tipo de imagem altamente compactada. De propriedade da Unisys, o GIF usa o algoritmo de compactação LZW que não degrada a qualidade da imagem. Para cada imagem, o GIF normalmente permite até 8 bits por pixel e até 256 cores são permitidas na imagem. Em contraste com uma imagem JPEG, que pode exibir até 16 milhões de cores e toca bastante os limites do olho humano. Quando a internet surgiu, os GIFs continuaram sendo a melhor escolha porque exigiam baixa largura de banda e compatível com os gráficos que consomem áreas sólidas de cor. Um GIF animado combina várias imagens ou quadros em um único arquivo e os exibe em uma sequência para gerar um clipe animado ou um vídeo curto. As limitações de cores são de até 256 para cada quadro e provavelmente serão as menos adequadas para reproduzir outras imagens e fotografias com gradiente de cores.

    consulte Mais informação

    DOC O que é DOC Formato de arquivo

    Arquivos com extensão .doc representam documentos gerados pelo Microsoft Word ou outros documentos de processamento de texto em formato de arquivo binário. A extensão foi inicialmente usada para documentação de texto simples em vários sistemas operacionais diferentes. Ele pode conter vários tipos diferentes de dados, como imagens, formatação e texto simples, gráficos, tabelas, objetos incorporados, links, páginas, formatação de página, configurações de impressão e muitos outros. O formato era popular para todo tipo de documentação devido à variedade de opções que oferece aos usuários para escrever manuais, propostas, especificações, currículos, artigos ou documentos semelhantes. A versão atualizada do DOC é o DOCX, que é baseado no Office OpenXML, cujas especificações estão disponíveis abertamente.

    consulte Mais informação

    TXT (Arquivo de documento de texto)
    Text (Arquivo de documento de texto)
    DOC (Documentos gerados pelo Microsoft Word)
    DOCX (Documentos do Microsoft Word)
    XLS (Formato de arquivo binário do Microsoft Excel)
    XLSX (Documentos do Microsoft Excel)
    PDF (Formato de Documento Portátil (PDF))
    Searchable PDF (Gráficos de rede portáteis pesquisáveis)
    XML (Extensible Markup Language)
    JSON (Notação de Objeto JavaScript)