elabora le immagini scansionate o anche le foto dello smartphone in formato JP2 e crea documenti JP2 contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR
Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine JP2 in un documento Searchable PDF:
- Crea un’istanza della classe AsposeOcr
- Chiama il metodo AsposeOCR.RecognizePage
- Passa il percorso del file JP2 come parametro
- AsposeOCR.RecognizePage restituisce una stringa o un file di tipo Searchable PDF
Requisiti di sistema
Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.
- È installato JDK 1.6 o versioni successive.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
JP2 Cos'è JP2 Formato del file
JPEG 2000 (JP2) è un sistema di codifica delle immagini e uno standard di compressione delle immagini all'avanguardia. Progettato, utilizzando la tecnologia wavelet, JPEG 2000 può codificare contenuti senza perdita di qualità in qualsiasi qualità contemporaneamente. Inoltre, senza alcuna penalizzazione sostanziale nell'efficienza della codifica, JPEG 2000 ha la capacità di accedere e decodificare efficacemente lo stesso contenuto in una varietà di altre risoluzioni e qualità. I flussi di codice in JPEG 2000 sono significativamente scalabili con regioni di interesse che forniscono la struttura per l'accesso casuale spaziale. Possedendo fino a 16384 diversi componenti con le dimensioni in terapixel e una precisione che può arrivare fino a 38 bit/campione.
Leggi di piùSearchable PDF Cos'è Searchable PDF Formato del file
I file PDF ricercabili conservano l'immagine scansionata originale per la visualizzazione, nonché il testo OCR in un livello nascosto che può essere utilizzato per ricerche full-text all'interno di un documento o per evidenziare il testo per operazioni di copia e incolla. La conversione OCR completa in PDF, esclusa l'immagine originale, non manterrà mai il 100% della formattazione originale, soprattutto se il documento ha molte immagini o un layout complesso.
Leggi di più