Aspose.OCR  for Java

Converteer afbeeldingen en PDF's naar tekst in Java

Maak eenvoudig platformonafhankelijke Java-applicaties met optische tekenherkenning (OCR)-mogelijkheden.

  Download Free Trial
  
 

Met Aspose.OCR voor Java kunt u tekst extraheren uit afbeeldingen, schermafbeeldingen, specifieke delen van een afbeelding en doorzoekbare PDF's maken van gescande bestanden op elk platform dat Java ondersteunt. Met zijn krachtige en toch gebruiksvriendelijke API nemen zelfs de complexe OCR-taken minder dan 10 regels code in beslag. U hoeft niet met formules en machine learning te werken - de bibliotheek zorgt voor alle technische details en produceert betrouwbare resultaten in 26 talen op basis van Latijnse en Cyrillische scripts, evenals Chinees . OCR API verwerkt gescande afbeeldingen, smartphonefoto's, screenshots, delen van afbeeldingen en gescande PDF's en geeft resultaten terug in de meest populaire documentformaten. Herkenningssnelheid, nauwkeurigheid en prestaties kunnen verder worden verbeterd door berekening over meerdere CPU-kernen te verdelen en resource-intensieve taken naar de GPU te verplaatsen.

Functies en mogelijkheden van Aspose.OCR voor Java

Herkent opgemaakte tekst in gescande afbeeldingen en PDF's

Ondersteunt alle bestandsindelingen die u kunt krijgen van een scanner of camera

Leest Latijnse en Cyrillische schriften

Herkent meer dan 6.000 Chinese karakters

Detecteert en herkent alle populaire lettertypen

Bewaart lettertypestijlen en opmaak zorgvuldig

Verwerkt alleen de hele afbeelding of geselecteerde gebieden

Ondersteunt gedraaide, scheve afbeeldingen en afbeeldingen met ruis

Batchherkenning van alle afbeeldingen in een map of archief

Herkent afbeeldingen die worden aangeboden als weblinks

Vindt en corrigeert automatisch verkeerd gespelde woorden

100% compatibiliteit met andere Aspose-producten

Makkelijk te installeren

U kunt Aspose.OCR voor Java rechtstreeks vanuit een op Maven gebaseerd project gebruiken door eenvoudige installatie-instructies te volgen .

Vraag een tijdelijke licentie aan om te beginnen met het bouwen van een volledig functionele OCR-applicatie zonder limieten en beperkingen.

$Easy to Use$

Voor beeldherkenning zijn een paar regels code nodig. Letterlijk. Het is echt zo simpel - probeer het zelf:

Afbeelding naar tekst in 7 regels - Java

// Instantie van OCR API maken
AsposeOCR api = new AsposeOCR();

try {
    // Herken afbeelding
    String result = api.RecognizePage(imagePath);
    // Geef het herkenningsresultaat weer
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // Foutafhandeling
    e.printStackTrace();
}

26 herkenningstalen

OCR API ondersteunt een groot aantal talen en alle populaire schrijfscripts, inclusief teksten met gemengde talen. De ingebouwde spellingcontrole vervangt automatisch verkeerd gespelde woorden en bespaart u de moeite om herkenningsresultaten handmatig te corrigeren.

  • Uitgebreid Latijns alfabet : Kroatisch, Tsjechisch, Deens, Nederlands, Engels, Estisch, Fins, Frans, Duits, Italiaans, Lets, Litouws, Noors, Pools, Portugees, Roemeens, Slowaaks, Sloveens, Spaans, Zweeds.
  • Cyrillisch alfabet : Wit-Russisch, Bulgaars, Kazachs, Russisch, Servisch, Oekraïens.
  • Chinees : meer dan 6.000 karakters.

U kunt de taal specificeren om de herkenningsprestaties en betrouwbaarheid te verbeteren of de API talen automatisch laten detecteren.

Opmaak behouden

De OCR API leest alle populaire lettertypen zoals Arial, Times New Roman, Courier New, Tahoma, Calibri en meer in normale, vetgedrukte en cursieve stijlen en behoudt zorgvuldig de opmaak in OCR-resultaten. U kunt herkenningsresultaten ook in regels splitsen en tekstgebieden op een pagina detecteren.

Foto's herkennen

Scanner is niet altijd beschikbaar op werkstations van eindgebruikers, wat een showstopper kan worden voor OCR-toepassingen. Onze OCR-API biedt een aantal voorbewerkingsfilters die vervormde, geroteerde, scheve en lawaaierige afbeeldingen aankunnen. In combinatie met ondersteuning voor alle beeldformaten zorgt het voor een betrouwbare herkenning van zelfs smartphonefoto's. De meeste voorbewerkingen en beeldcorrecties gebeuren automatisch, maar in moeilijke gevallen kan je altijd ingrijpen.

Pas beeldcorrecties toe - Java

// Instantie van OCR API maken
AsposeOCR api = new AsposeOCR();

// Voorbewerkingsfilters definiëren
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Voorbewerking van afbeelding vóór herkenning
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Herken afbeelding
RecognitionResult result = api.RecognizePage(imageRes, set);

Prestatie-optimalisatie

Optische tekenherkenning vereist veel verwerkingsbronnen, wat een probleem kan worden voor webservices en apparaten op instapniveau. De API biedt zeer flexibele manieren om herkenningssnelheid, resourcevereisten en nauwkeurigheid in evenwicht te brengen:

  • Kies tussen grondige herkenning en snelle herkenning.
  • Geef het aantal threads op dat is toegewezen voor herkenning, of laat de bibliotheek automatisch schalen naar het aantal CPU-cores.
  • Maak de CPU vrij door de berekeningen naar de GPU te verplaatsen.

Snelle herkenning - Java

// Instantie van OCR API maken
AsposeOCR api = new AsposeOCR();

// Herken afbeelding in de snelste modus
String result = api.RecognizePageFast("sample.jpg");

Batchverwerking

Dankzij de OCR-API hoeft u niet elke afbeelding één voor één te herkennen door verschillende batchverwerkingsmethoden aan te bieden waarmee u meerdere afbeeldingen in één aanroep kunt herkennen:

  • Herkenning van PDF- en TIFF-bestanden met meerdere pagina's.
  • Herkenning van alle bestanden in een archief.
  • Herkenning van alle bestanden in een map.
  
  

Aspose biedt ook native OCR API's voor andere populaire programmeertalen: