HTML JPG OCR XML BMP
Aspose.OCR  per Java
XML

Aspose.Imaging per Java

elabora le immagini scansionate o anche le foto dello smartphone in formato TIFF e crea documenti TIFF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR

Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine TIFF in un documento XML:

  • Crea un’istanza della classe AsposeOcr
  • Chiama il metodo AsposeOCR.RecognizePage
  • Passa il percorso del file TIFF come parametro
  • AsposeOCR.RecognizePage restituisce una stringa o un file di tipo XML

Requisiti di sistema

Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.

  • È installato JDK 1.6 o versioni successive.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • TIFF Cos'è TIFF Formato del file

    TIFF o TIF, Tagged Image File Format, rappresenta immagini raster destinate all'uso su una varietà di dispositivi conformi a questo standard di formato file. È in grado di descrivere dati di immagini a due livelli, in scala di grigi, a colori ea colori in diversi spazi colore. Supporta schemi di compressione lossy e lossless per scegliere tra spazio e tempo per le applicazioni che utilizzano il formato. Il formato è estensibile e ha subito diverse revisioni che consentono l'inclusione di una quantità illimitata di informazioni private o per scopi speciali. Il formato non dipende dalla macchina ed è libero da limiti come processore, sistema operativo o file system.

    Leggi di più

    XML Cos'è XML Formato del file

    XML sta per Extensible Markup Language che è simile a HTML ma diverso nell'uso dei tag per definire gli oggetti. L'idea alla base della creazione del formato file XML era quella di archiviare e trasportare i dati senza dipendere da strumenti software o hardware. La sua popolarità è dovuta al fatto che è leggibile sia dall'uomo che dalla macchina. Ciò consente di creare protocolli di dati comuni sotto forma di oggetti da archiviare e condividere su una rete come il World Wide Web (WWW). La "X" in XML è estensibile, il che implica che il linguaggio può essere esteso a qualsiasi numero di simboli secondo i requisiti dell'utente. È per queste funzionalità che molti formati di file standard ne fanno uso come Microsoft Open XML, LibreOffice OpenDocument, XHTML e SVG.

    Leggi di più

    TXT (File di documento di testo)
    Text (File di documento di testo)
    DOC (Documenti generati da Microsoft Word)
    DOCX (Documenti Microsoft Word)
    XLS (Formato file binario Microsoft Excel)
    XLSX (Documenti Microsoft Excel)
    PDF (Formato documento portatile (PDF))
    Searchable PDF (Grafica di rete portatile ricercabile)
    XML (Linguaggio di markup estensibile)
    JSON (Notazione oggetto JavaScript)