HTML JPG OCR XML BMP
Aspose.OCR  per Java
DOCX

Aspose.Imaging per Java

elabora le immagini scansionate o anche le foto dello smartphone in formato GIF e crea documenti GIF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine GIF in un documento DOCX:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.RecognizePage
  • Passa il percorso del file GIF come parametro
  • AsposeOCR.RecognizePage restituisce una stringa o un file di tipo DOCX

Requisiti di sistema

Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.

  • È installato JDK 1.6 o versioni successive.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • GIF Cos'è GIF Formato del file

    Un formato GIF o Graphical Interchange Format è un tipo di immagine altamente compressa. Di proprietà di Unisys, GIF utilizza l'algoritmo di compressione LZW che non degrada la qualità dell'immagine. Per ogni immagine GIF in genere consentono fino a 8 bit per pixel e sono consentiti fino a 256 colori nell'immagine. In contrasto con un'immagine JPEG, che può visualizzare fino a 16 milioni di colori e tocca abbastanza i limiti dell'occhio umano. Quando è emerso Internet, le GIF sono rimaste la scelta migliore perché richiedevano una larghezza di banda ridotta e compatibili per la grafica che consuma aree di colore solide. Una GIF animata combina numerose immagini o fotogrammi in un unico file e le visualizza in sequenza per generare una clip animata o un breve video. I limiti di colore sono fino a 256 per ogni fotogramma e sono probabilmente i meno adatti per riprodurre altre immagini e fotografie con gradiente di colore.

    Leggi di più

    DOCX Cos'è DOCX Formato del file

    DOCX è un formato ben noto per i documenti di Microsoft Word. Introdotto dal 2007 con il rilascio di Microsoft Office 2007, la struttura di questo nuovo formato del documento è stata modificata da semplice binario a una combinazione di file XML e binari. I file Docx possono essere aperti con Word 2007 e versioni laterali ma non con le versioni precedenti di MS Word che supportano le estensioni di file DOC.

    Leggi di più

    TXT (File di documento di testo)
    Text (File di documento di testo)
    DOC (Documenti generati da Microsoft Word)
    DOCX (Documenti Microsoft Word)
    XLS (Formato file binario Microsoft Excel)
    XLSX (Documenti Microsoft Excel)
    PDF (Formato documento portatile (PDF))
    Searchable PDF (Grafica di rete portatile ricercabile)
    XML (Linguaggio di markup estensibile)
    JSON (Notazione oggetto JavaScript)