HTML JPG OCR XML BMP
Aspose.OCR  per Java
DOC

Aspose.Imaging per Java

elabora le immagini scansionate o anche le foto dello smartphone in formato JPEG2000 e crea documenti JPEG2000 contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine JPEG2000 in un documento DOC:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.RecognizePage
  • Passa il percorso del file JPEG2000 come parametro
  • AsposeOCR.RecognizePage restituisce una stringa o un file di tipo DOC

Requisiti di sistema

Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.

  • È installato JDK 1.6 o versioni successive.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPEG2000 Cos'è JPEG2000 Formato del file

    JPEG 2000 (JP2) è un sistema di codifica delle immagini e uno standard di compressione delle immagini all'avanguardia. Progettato, utilizzando la tecnologia wavelet, JPEG 2000 può codificare contenuti senza perdita di qualità in qualsiasi qualità contemporaneamente. Inoltre, senza alcuna penalizzazione sostanziale nell'efficienza della codifica, JPEG 2000 ha la capacità di accedere e decodificare efficacemente lo stesso contenuto in una varietà di altre risoluzioni e qualità. I flussi di codice in JPEG 2000 sono significativamente scalabili con regioni di interesse che forniscono la struttura per l'accesso casuale spaziale. Possedendo fino a 16384 diversi componenti con le dimensioni in terapixel e una precisione che può arrivare fino a 38 bit/campione.

    Leggi di più

    DOC Cos'è DOC Formato del file

    I file con estensione .doc rappresentano documenti generati da Microsoft Word o altri documenti di elaborazione testi in formato binario. L'estensione è stata inizialmente utilizzata per la documentazione in testo normale su diversi sistemi operativi. Può contenere diversi tipi di dati come immagini, formattati e testo normale, grafici, grafici, oggetti incorporati, collegamenti, pagine, formattazione della pagina, impostazioni di stampa e molti altri. Il formato era popolare per tutti i tipi di documentazione grazie alla varietà di opzioni che offre agli utenti per la scrittura di manuali, proposte, specifiche, curriculum, articoli o documenti simili. La versione aggiornata di DOC è DOCX che si basa su Office OpenXML le cui specifiche sono pubblicamente disponibili.

    Leggi di più

    TXT (File di documento di testo)
    Text (File di documento di testo)
    DOC (Documenti generati da Microsoft Word)
    DOCX (Documenti Microsoft Word)
    XLS (Formato file binario Microsoft Excel)
    XLSX (Documenti Microsoft Excel)
    PDF (Formato documento portatile (PDF))
    Searchable PDF (Grafica di rete portatile ricercabile)
    XML (Linguaggio di markup estensibile)
    JSON (Notazione oggetto JavaScript)