verwerkt gescande afbeeldingen of zelfs smartphonefoto’s in BMP-indeling en maakt BMP-documenten met herkende tekst. Om het aan uw project toe te voegen, hoeft u alleen maar Aspose.OCR te downloaden.
Maven of specificeer de Aspose Maven Repository-configuratie en installeer het binnen uw op Maven gebaseerde project door de volgende configuraties toe te voegen aan de pom.xml. Bekijk voor voorbeelden van Graddle, Ivy en Sbt onze repository .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
Met Java OCR en slechts een paar regels code, kunt u een complete applicatie maken die een BMP-afbeelding converteert naar een Searchable PDF-document:
- Maak een instantie van de AsposeOcr-klasse
- Roep AsposeOCR.RecognizePage-methode aan
- Geef het BMP bestandspad door als parameter
- AsposeOCR.RecognizePage retourneert een tekenreeks of bestand van het type Searchable PDF
systeem vereisten
Voordat u het voorbeeld uitvoert, moet u ervoor zorgen dat Java 2 Platform, Standard Edition (J2SE) 6.0 (1.6) of hoger op uw systeem is geïnstalleerd.
- JDK 1.6 of hoger is geïnstalleerd.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
BMP Wat is BMP Bestandsformaat
Bestanden met de extensie .BMP vertegenwoordigen Bitmap Image-bestanden die worden gebruikt om digitale bitmapafbeeldingen op te slaan. Deze afbeeldingen zijn onafhankelijk van de grafische adapter en worden ook wel apparaatonafhankelijke bitmap (DIB)-bestandsindeling genoemd. Deze onafhankelijkheid dient om het bestand op meerdere platforms te openen, zoals Microsoft Windows en Mac. Het BMP-bestandsformaat kan gegevens opslaan als tweedimensionale digitale afbeeldingen in zowel zwart-wit als kleurformaat met verschillende kleurdiepten.
Lees verderSearchable PDF Wat is Searchable PDF Bestandsformaat
Doorzoekbare PDF-bestanden behouden de originele gescande afbeelding voor weergave, evenals OCR-tekst in een verborgen laag die kan worden gebruikt voor zoekopdrachten in volledige tekst in een document of om tekst te markeren voor kopieer- en plakbewerkingen. Volledige OCR-conversie naar PDF, exclusief de originele afbeelding, zal nooit 100% van de originele opmaak behouden, vooral als het document veel afbeeldingen of een complexe lay-out heeft.
Lees verder