Aspose.OCR  for Java

Konvertera bilder och PDF-filer till text i Java

Skapa enkelt Java-applikationer över plattformar med funktioner för optisk teckenigenkänning (OCR).

  Download Free Trial
  
 

Aspose.OCR för Java låter dig extrahera text från bilder, skärmdumpar, specifika delar av en bild och skapa sökbara PDF-filer från skannade filer på vilken plattform som helst som stöder Java. Med sitt kraftfulla men lättanvända API tar även de komplexa OCR-uppgifterna mindre än 10 rader kod. Du behöver inte arbeta med formler och maskininlärning - biblioteket tar hand om alla tekniska detaljer och producerar tillförlitliga resultat på 26 språk baserade på latinska och kyrilliska skript, samt kinesiska . OCR API bearbetar skannade bilder, smartphonefoton, skärmdumpar, bildområden och skannade PDF-filer och returnerar resultat i de mest populära dokumentformaten. Igenkänningshastighet, noggrannhet och prestanda kan förbättras ytterligare genom att distribuera beräkningar över flera CPU-kärnor och ladda ner resurskrävande uppgifter till GPU :n.

Funktioner och funktioner i Aspose.OCR för Java

Känner igen formaterad text i skannade bilder och PDF-filer

Stöder alla filformat du kan få från en skanner eller kamera

Läser latinska och kyrilliska skrifter

Känner igen mer än 6 000 kinesiska tecken

Upptäcker och känner igen alla populära typsnitt

Bevarar noggrant teckensnittsstilar och formatering

Bearbetar endast hela bilden eller valda områden

Stöder roterade, sneda och brusiga bilder

Batchigenkänning av alla bilder i en mapp eller arkiv

Känner igen bilder som tillhandahålls som webblänkar

Hittar och korrigerar automatiskt felstavade ord

100 % kompatibilitet med andra Aspose-produkter

Lätt att installera

Du kan använda Aspose.OCR för Java direkt från ett Maven- baserat projekt genom att följa enkla installationsinstruktioner .

Begär en tillfällig licens för att börja bygga en fullt fungerande OCR-applikation utan några begränsningar och restriktioner.

$Easy to Use$

Bildigenkänning kräver ett par rader kod. Bokstavligen. Det är verkligen så enkelt - prova själv:

Bild till text på 7 rader - Java

// Skapa instans av OCR API
AsposeOCR api = new AsposeOCR();

try {
    // Känner igen bilden
    String result = api.RecognizePage(imagePath);
    // Visa igenkänningsresultatet
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // Felhantering
    e.printStackTrace();
}

26 igenkänningsspråk

OCR API stöder ett stort antal språk och alla populära skrivskript, inklusive texter med blandade språk. Den inbyggda stavningskontrollen ersätter automatiskt felstavade ord och sparar dig besväret att manuellt korrigera igenkänningsresultat.

  • Utökat latinska alfabet : kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska.
  • Kyrilliska alfabetet : vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska.
  • Kinesiska : mer än 6 000 tecken.

Du kan ange språket för att öka igenkänningsprestandan och tillförlitligheten eller låta API:et upptäcka språk automatiskt.

Bevara formateringen

OCR API läser alla populära typsnitt som Arial, Times New Roman, Courier New, Tahoma, Calibri och mer i vanliga, fetstilta och kursiv stilar och bevarar noggrant formateringen i OCR-resultat. Du kan också dela upp igenkänningsresultat i rader och upptäcka textområden på en sida.

Känner igen foton

Skannern är inte alltid tillgänglig på slutanvändararbetsstationer, vilket kan bli en showstopper för OCR-applikationer. Vårt OCR API tillhandahåller ett antal förbehandlingsfilter som kan hantera förvrängda, roterade, sneda och brusiga bilder. I kombination med stöd för alla bildformat möjliggör det tillförlitlig igenkänning av även smartphonefoton. Det mesta av förbearbetningen och bildkorrigeringen sker automatiskt, men du kan alltid ingripa i svåra fall.

Använd bildkorrigeringar - Java

// Skapa instans av OCR API
AsposeOCR api = new AsposeOCR();

// Definiera förbehandlingsfilter
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Förbearbeta bilden före igenkänning
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Känner igen bilden
RecognitionResult result = api.RecognizePage(imageRes, set);

Prestandaoptimering

Optisk teckenigenkänning kräver mycket bearbetningsresurser, vilket kan bli ett problem för webbtjänster och enheter på nybörjarnivå. API:et erbjuder mycket flexibla sätt att balansera igenkänningshastighet, resurskrav och noggrannhet:

  • Välj mellan grundlig igenkänning och snabb igenkänning.
  • Ange antalet trådar som tilldelats för igenkänning, eller låt biblioteket automatiskt skala till antalet CPU-kärnor.
  • Frigör CPU:n genom att ladda ner beräkningarna till GPU:n.

Snabb igenkänning - Java

// Skapa instans av OCR API
AsposeOCR api = new AsposeOCR();

// Känn igen bilden i det snabbaste läget
String result = api.RecognizePageFast("sample.jpg");

Satsvis bearbetning

OCR API befriar dig från att behöva känna igen varje bild en i taget genom att erbjuda olika batchbehandlingsmetoder som låter dig känna igen flera bilder i ett enda samtal:

  • Igenkänning av flersidiga PDF- och TIFF-filer.
  • Igenkänning av alla filer i ett arkiv.
  • Igenkänning av alla filer i en mapp.
  
  
  

Aspose erbjuder också inbyggda OCR API:er för andra populära programmeringsspråk: