HTML JPG OCR XML BMP
Aspose.OCR  voor Java
TXT

Aspose.Imaging voor Java

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in WBMP-indeling en maakt WBMP-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.

Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Met Java OCR en slechts een paar regels code, kunt u een complete applicatie maken die een WBMP-afbeelding converteert naar een TXT-document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep AsposeOCR.RecognizePage-methode aan
  • Geef het WBMP bestandspad door als parameter
  • AsposeOCR.RecognizePage retourneert een tekenreeks of bestand van het type TXT

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) of hoger op uw systeem is geïnstalleerd.

  • JDK 1.6 of hoger is geïnstalleerd.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • WBMP Wat is WBMP Bestandsformaat

    WBMP is een monochrome grafische bestandsindeling die is geoptimaliseerd voor mobiele computerapparatuur. WBMP-afbeeldingen zijn monochroom (zwart-wit) zodat de afbeeldingsgrootte tot een minimum wordt beperkt. Een zwarte pixel wordt aangeduid met 0 en een witte pixel wordt aangeduid met 1.

    Lees verder

    TXT Wat is TXT Bestandsformaat

    Een bestand met de extensie .TXT vertegenwoordigt een tekstdocument dat platte tekst in de vorm van regels bevat. Alinea's in een tekstdocument worden herkend door regelterugloop en worden gebruikt om de bestandsinhoud beter te ordenen. Een standaard tekstdocument kan in elke teksteditor of tekstverwerkingsprogramma op verschillende besturingssystemen worden geopend. Alle tekst in zo'n bestand is in een voor mensen leesbaar formaat en wordt weergegeven door een reeks tekens.

    Lees verder

    TXT (Tekstdocumentbestand)
    Text (Tekstdocumentbestand)
    DOC (Documenten gegenereerd door Microsoft Word)
    DOCX (Microsoft Word-documenten)
    XLS (Microsoft Excel binaire bestandsindeling)
    XLSX (Microsoft Excel-documenten)
    PDF (Draagbaar documentformaat (PDF))
    Searchable PDF (Doorzoekbare draagbare netwerkgraphics)
    XML (Uitbreidbare opmaaktaal)
    JSON (JavaScript-objectnotatie)