HTML JPG OCR XML BMP
Aspose.OCR  per Java
XLSX

Aspose.Imaging per Java

elabora le immagini scansionate o anche le foto dello smartphone in formato DJVU e crea documenti DJVU contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine DJVU in un documento XLSX:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.RecognizePage
  • Passa il percorso del file DJVU come parametro
  • AsposeOCR.RecognizePage restituisce una stringa o un file di tipo XLSX

Requisiti di sistema

Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.

  • È installato JDK 1.6 o versioni successive.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • DJVU Cos'è DJVU Formato del file

    DjVu, pronunciato come "déjà vu", è un formato di file grafico destinato a documenti e libri scansionati, in particolare quelli che contengono la combinazione di testo, disegni, immagini e fotografie. È stato sviluppato da AT&T Labs. Utilizza più tecniche come la separazione del livello dell'immagine del testo e delle immagini di sfondo, il caricamento progressivo, la codifica aritmetica e la compressione con perdita di dati per le immagini bitonali. Poiché il file DJVU può contenere immagini a colori, fotografie, testo e disegni compressi ma di alta qualità e può essere salvato in meno spazio, quindi viene utilizzato sul Web come eBook, manuali, giornali, documenti antichi, ecc.

    Leggi di più

    XLSX Cos'è XLSX Formato del file

    XLSX è un formato noto per i documenti Microsoft Excel che è stato introdotto da Microsoft con il rilascio di Microsoft Office 2007. Basato su una struttura organizzata secondo le Open Packaging Conventions come delineato nella Parte 2 dello standard OOXML ECMA-376, il nuovo formato è un pacchetto zip che contiene un numero di file XML. La struttura ei file sottostanti possono essere esaminati semplicemente decomprimendo il file .xlsx.

    Leggi di più