HTML JPG OCR XML BMP
Aspose.OCR  voor Java
Searchable PDF

Aspose.Imaging voor Java

verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in JPEG2000-indeling en maakt JPEG2000-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.

Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .

Maven Dependency


 <dependency>
 <groupId>com.aspose</groupId>
 <artifactId>aspose-ocr</artifactId>
 <version>22.5</version>
 </dependency>

Met Java OCR en slechts een paar regels code, kunt u een complete applicatie maken die een JPEG2000-afbeelding converteert naar een Searchable PDF-document:

  • Maak een instantie van de AsposeOcr-klasse
  • Roep AsposeOCR.RecognizePage-methode aan
  • Geef het JPEG2000 bestandspad door als parameter
  • AsposeOCR.RecognizePage retourneert een tekenreeks of bestand van het type Searchable PDF

systeem vereisten

Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) of hoger op uw systeem is geïnstalleerd.

  • JDK 1.6 of hoger is geïnstalleerd.


 //Create API instance
 AsposeOCR api = new AsposeOCR();

 //Prepare rectangles with texts.
 ArrayList rectArray = new ArrayList();

 rectArray.add(new Rectangle(138, 352, 2033, 537));
 rectArray.add(new Rectangle(147, 890, 2033, 1157));

 String result = api.RecognizePage("srcImage.png", rectArray);
 System.out.println("Result with rect: " + result);
  • JPEG2000 Wat is JPEG2000 Bestandsformaat

    JPEG 2000 (JP2) is een beeldcoderingssysteem en de modernste beeldcompressiestandaard. Ontworpen, met behulp van wavelet-technologie, kan JPEG 2000 verliesvrije inhoud in elke kwaliteit tegelijk coderen. Bovendien heeft JPEG 2000, zonder enige substantiële schade aan de coderingsefficiëntie, de mogelijkheid om dezelfde inhoud op doeltreffende wijze te openen en te decoderen in een verscheidenheid aan andere resoluties en kwaliteiten. De codestromen in JPEG 2000 zijn aanzienlijk schaalbaar met interessegebieden die de mogelijkheid bieden voor ruimtelijke willekeurige toegang. Met tot 16384 verschillende componenten met afmetingen in terapixels en een precisie die kan oplopen tot 38 bits/sample.

    Lees verder

    Searchable PDF Wat is Searchable PDF Bestandsformaat

    Doorzoekbare PDF-bestanden behouden de originele gescande afbeelding voor weergave, evenals OCR-tekst in een verborgen laag die kan worden gebruikt voor zoekopdrachten in volledige tekst in een document of om tekst te markeren voor kopieer- en plakbewerkingen. Volledige OCR-conversie naar PDF, exclusief de originele afbeelding, zal nooit 100% van de originele opmaak behouden, vooral als het document veel afbeeldingen of een complexe lay-out heeft.

    Lees verder

    TXT (Tekstdocumentbestand)
    Text (Tekstdocumentbestand)
    DOC (Documenten gegenereerd door Microsoft Word)
    DOCX (Microsoft Word-documenten)
    XLS (Microsoft Excel binaire bestandsindeling)
    XLSX (Microsoft Excel-documenten)
    PDF (Draagbaar documentformaat (PDF))
    Searchable PDF (Doorzoekbare draagbare netwerkgraphics)
    XML (Uitbreidbare opmaaktaal)
    JSON (JavaScript-objectnotatie)