elabora le immagini scansionate o anche le foto dello smartphone in formato PDF e crea documenti PDF contenenti testo riconosciuto. Per aggiungerlo al tuo progetto, devi solo ottenere Aspose.OCR
Maven o specifica la configurazione di Aspose Maven Repository e installalo all’interno del tuo progetto basato su Maven aggiungendo le seguenti configurazioni a pom.xml. Per gli esempi di Graddle, Ivy, Sbt dai un’occhiata al nostro repository .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Con Java OCR e solo poche righe di codice, puoi creare un’applicazione completa che converte un’immagine PDF in un documento TXT:
- Crea un’istanza della classe AsposeOcr
- Chiama il metodo AsposeOCR.RecognizePage
- Passa il percorso del file PDF come parametro
- AsposeOCR.RecognizePage restituisce una stringa o un file di tipo TXT
Requisiti di sistema
Prima di eseguire l’esempio, assicurarsi che Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) o successivo sia installato sul sistema.
- È installato JDK 1.6 o versioni successive.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
PDF Cos'è PDF Formato del file
Portable Document Format (PDF) è un tipo di documento creato da Adobe negli anni '90. Lo scopo di questo formato di file era quello di introdurre uno standard per la rappresentazione di documenti e altro materiale di riferimento in un formato indipendente dal software applicativo, dall'hardware e dal sistema operativo. Il formato di file PDF ha la piena capacità di contenere informazioni come testo, immagini, collegamenti ipertestuali, campi modulo, rich media, firme digitali, allegati, metadati, caratteristiche geospaziali e oggetti 3D che possono diventare parte del documento di origine.
Leggi di piùTXT Cos'è TXT Formato del file
Un file con estensione .TXT rappresenta un documento di testo che contiene testo normale sotto forma di righe. I paragrafi in un documento di testo sono riconosciuti dai ritorni a capo e sono utilizzati per una migliore disposizione del contenuto del file. Un documento di testo standard può essere aperto in qualsiasi editor di testo o applicazione di elaborazione testi su diversi sistemi operativi. Tutto il testo contenuto in tale file è in formato leggibile e rappresentato da una sequenza di caratteri.
Leggi di più