HTML JPG OCR XML BMP

Searchable PDF

elabora le immagini scansionate o anche le foto dello smartphone in formato WBMP e crea documenti WBMP contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Maven Dependency
 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine WBMP in un documento Searchable PDF:

Crea un’istanza della classe AsposeOcr
Chiama il metodo AsposeOCR.RecognizePage
Passa il percorso del file WBMP come parametro
AsposeOCR.RecognizePage restituisce una stringa o un file di tipo Searchable PDF

Requisiti di sistema

Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.

È installato JDK 1.6 o versioni successive.

 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);

WBMP Cos'è WBMP Formato del file

WBMP è un formato di file grafico monocromatico ottimizzato per i dispositivi mobili. Le immagini WBMP sono monocromatiche (bianco e nero) in modo che le dimensioni dell'immagine siano ridotte al minimo. Un pixel nero è indicato con 0 e un pixel bianco è indicato con 1.

Searchable PDF Cos'è Searchable PDF Formato del file

I file PDF ricercabili conservano l'immagine scansionata originale per la visualizzazione, nonché il testo OCR in un livello nascosto che può essere utilizzato per ricerche full-text all'interno di un documento o per evidenziare il testo per operazioni di copia e incolla. La conversione OCR completa in PDF, esclusa l'immagine originale, non manterrà mai il 100% della formattazione originale, soprattutto se il documento ha molte immagini o un layout complesso.

TXT (File di documento di testo)

Text (File di documento di testo)

DOC (Documenti generati da Microsoft Word)

DOCX (Documenti Microsoft Word)

XLS (Formato file binario Microsoft Excel)

XLSX (Documenti Microsoft Excel)

PDF (Formato documento portatile (PDF))

Searchable PDF (Grafica di rete portatile ricercabile)

XML (Linguaggio di markup estensibile)

JSON (Notazione oggetto JavaScript)

Aspose.OCR per Java

Overview

Maven Dependency

Requisiti di sistema

WBMP Cos'è WBMP Formato del file

Searchable PDF Cos'è Searchable PDF Formato del file