HTML JPG OCR XML BMP
Aspose.OCR  per Java
XML

Aspose.Imaging per Java

elabora le immagini scansionate o anche le foto dello smartphone in formato DJVU e crea documenti DJVU contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine DJVU in un documento XML:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.RecognizePage
  • Passa il percorso del file DJVU come parametro
  • AsposeOCR.RecognizePage restituisce una stringa o un file di tipo XML

Requisiti di sistema

Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.

  • È installato JDK 1.6 o versioni successive.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • DJVU Cos'è DJVU Formato del file

    DjVu, pronunciato come "déjà vu", è un formato di file grafico destinato a documenti e libri scansionati, in particolare quelli che contengono la combinazione di testo, disegni, immagini e fotografie. È stato sviluppato da AT&T Labs. Utilizza più tecniche come la separazione del livello dell'immagine del testo e delle immagini di sfondo, il caricamento progressivo, la codifica aritmetica e la compressione con perdita di dati per le immagini bitonali. Poiché il file DJVU può contenere immagini a colori, fotografie, testo e disegni compressi ma di alta qualità e può essere salvato in meno spazio, quindi viene utilizzato sul Web come eBook, manuali, giornali, documenti antichi, ecc.

    Leggi di più

    XML Cos'è XML Formato del file

    XML sta per Extensible Markup Language che è simile a HTML ma diverso nell'uso dei tag per definire gli oggetti. L'idea alla base della creazione del formato file XML era quella di archiviare e trasportare i dati senza dipendere da strumenti software o hardware. La sua popolarità è dovuta al fatto che è leggibile sia dall'uomo che dalla macchina. Ciò consente di creare protocolli di dati comuni sotto forma di oggetti da archiviare e condividere su una rete come il World Wide Web (WWW). La "X" in XML è estensibile, il che implica che il linguaggio può essere esteso a qualsiasi numero di simboli secondo i requisiti dell'utente. È per queste funzionalità che molti formati di file standard ne fanno uso come Microsoft Open XML, LibreOffice OpenDocument, XHTML e SVG.

    Leggi di più