HTML JPG OCR XML BMP
Aspose.OCR  para Java
XLSX

Aspose.Imaging for Java

processa imagens digitalizadas ou até mesmo fotos de smartphones no formato DJVU e cria documentos DJVU contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR

Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Com Java OCR e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem DJVU em um documento XLSX:

  • Crie uma instância da classe AsposeOcr
  • Chamar o método AsposeOCR.RecognizePage
  • Passe o caminho do arquivo DJVU como parâmetro
  • AsposeOCR.RecognizePage retorna uma String ou arquivo do tipo XLSX

Requisitos de sistema

Antes de executar o exemplo, certifique-se de que o Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou posterior esteja instalado em seu sistema.

  • JDK 1.6 ou superior está instalado.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • DJVU O que é DJVU Formato de arquivo

    DjVu, pronunciado como “déjà vu”, é um formato de arquivo gráfico destinado a documentos e livros digitalizados, especialmente aqueles que contêm a combinação de texto, desenhos, imagens e fotografias. Foi desenvolvido pela AT&T Labs. Ele usa várias técnicas, como separação de camadas de imagem de texto e imagens de fundo, carregamento progressivo, codificação aritmética e compactação com perdas para imagens bitonais. Como o arquivo DJVU pode conter imagens coloridas, fotografias, textos e desenhos compactados e de alta qualidade e pode ser salvo em menos espaço, ele é usado na web como eBooks, manuais, jornais, documentos antigos etc.

    consulte Mais informação

    XLSX O que é XLSX Formato de arquivo

    XLSX é um formato bem conhecido para documentos do Microsoft Excel que foi introduzido pela Microsoft com o lançamento do Microsoft Office 2007. um pacote zip que contém vários arquivos XML. A estrutura e os arquivos subjacentes podem ser examinados simplesmente descompactando o arquivo .xlsx.

    consulte Mais informação