HTML JPG OCR XML BMP
Aspose.OCR  para Java
XLSX

Aspose.Imaging for Java

processa imagens digitalizadas ou até mesmo fotos de smartphones no formato WBMP e cria documentos WBMP contendo texto reconhecido. Para adicioná-lo ao seu projeto, você só precisa obter Aspose.OCR

Maven ou especifique a configuração do repositório Aspose Maven e instale-o em seu projeto baseado em Maven adicionando as seguintes configurações ao arquivo pom.xml. Para exemplos de Graddle, Ivy, Sbt, confira nosso repositório .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Com Java OCR e apenas algumas linhas de código, você pode criar um aplicativo completo que converte uma imagem WBMP em um documento XLSX:

  • Crie uma instância da classe AsposeOcr
  • Chamar o método AsposeOCR.RecognizePage
  • Passe o caminho do arquivo WBMP como parâmetro
  • AsposeOCR.RecognizePage retorna uma String ou arquivo do tipo XLSX

Requisitos de sistema

Antes de executar o exemplo, certifique-se de que o Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) ou posterior esteja instalado em seu sistema.

  • JDK 1.6 ou superior está instalado.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • WBMP O que é WBMP Formato de arquivo

    WBMP é um formato de arquivo gráfico monocromático otimizado para dispositivos de computação móvel. As imagens WBMP são monocromáticas (preto e branco) para que o tamanho da imagem seja mínimo. Um pixel preto é denotado por 0 e um pixel branco é denotado por 1.

    consulte Mais informação

    XLSX O que é XLSX Formato de arquivo

    XLSX é um formato bem conhecido para documentos do Microsoft Excel que foi introduzido pela Microsoft com o lançamento do Microsoft Office 2007. um pacote zip que contém vários arquivos XML. A estrutura e os arquivos subjacentes podem ser examinados simplesmente descompactando o arquivo .xlsx.

    consulte Mais informação

    TXT (Arquivo de documento de texto)
    Text (Arquivo de documento de texto)
    DOC (Documentos gerados pelo Microsoft Word)
    DOCX (Documentos do Microsoft Word)
    XLS (Formato de arquivo binário do Microsoft Excel)
    XLSX (Documentos do Microsoft Excel)
    PDF (Formato de Documento Portátil (PDF))
    Searchable PDF (Gráficos de rede portáteis pesquisáveis)
    XML (Extensible Markup Language)
    JSON (Notação de Objeto JavaScript)