verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in JPG-indeling en maakt JPG-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.
Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Met Java OCR en slechts een paar regels code, kunt u een complete applicatie maken die een JPG-afbeelding converteert naar een Text-document:
- Maak een instantie van de AsposeOcr-klasse
- Roep AsposeOCR.RecognizePage-methode aan
- Geef het JPG bestandspad door als parameter
- AsposeOCR.RecognizePage retourneert een tekenreeks of bestand van het type Text
systeem vereisten
Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) of hoger op uw systeem is geïnstalleerd.
- JDK 1.6 of hoger is geïnstalleerd.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
JPG Wat is JPG Bestandsformaat
Een JPEG is een type afbeeldingsformaat dat wordt opgeslagen met de methode van compressie met verlies. Het uitvoerbeeld, als resultaat van compressie, is een afweging tussen opslaggrootte en beeldkwaliteit. Gebruikers kunnen het compressieniveau aanpassen om het gewenste kwaliteitsniveau te bereiken en tegelijkertijd de opslagruimte verkleinen. De beeldkwaliteit wordt verwaarloosbaar beïnvloed als 10:1 compressie op de afbeelding wordt toegepast. Hoe hoger de compressiewaarde, hoe groter de verslechtering van de beeldkwaliteit.
Lees verderText Wat is Text Bestandsformaat
Een bestand met de extensie .TXT vertegenwoordigt een tekstdocument dat platte tekst in de vorm van regels bevat. Alinea's in een tekstdocument worden herkend door regelterugloop en worden gebruikt om de bestandsinhoud beter te ordenen. Een standaard tekstdocument kan in elke teksteditor of tekstverwerkingsprogramma op verschillende besturingssystemen worden geopend. Alle tekst in zo'n bestand is in een voor mensen leesbaar formaat en wordt weergegeven door een reeks tekens.
Lees verder