Konvertera bilder och PDF-filer till text i Java
Skapa enkelt Java-applikationer över plattformar med funktioner för optisk teckenigenkänning (OCR).
Download Free TrialAspose.OCR för Java låter dig extrahera text från bilder, skärmdumpar, specifika delar av en bild och skapa sökbara PDF-filer från skannade filer på vilken plattform som helst som stöder Java. Med sitt kraftfulla men lättanvända API tar även de komplexa OCR-uppgifterna mindre än 10 rader kod. Du behöver inte arbeta med formler och maskininlärning - biblioteket tar hand om alla tekniska detaljer och producerar tillförlitliga resultat på 26 språk baserade på latinska och kyrilliska skript, samt kinesiska . OCR API bearbetar skannade bilder, smartphonefoton, skärmdumpar, bildområden och skannade PDF-filer och returnerar resultat i de mest populära dokumentformaten. Igenkänningshastighet, noggrannhet och prestanda kan förbättras ytterligare genom att distribuera beräkningar över flera CPU-kärnor och ladda ner resurskrävande uppgifter till GPU :n.
Funktioner och funktioner i Aspose.OCR för Java
Känner igen formaterad text i skannade bilder och PDF-filer
Stöder alla filformat du kan få från en skanner eller kamera
Läser latinska och kyrilliska skrifter
Känner igen mer än 6 000 kinesiska tecken
Upptäcker och känner igen alla populära typsnitt
Bevarar noggrant teckensnittsstilar och formatering
Bearbetar endast hela bilden eller valda områden
Stöder roterade, sneda och brusiga bilder
Batchigenkänning av alla bilder i en mapp eller arkiv
Känner igen bilder som tillhandahålls som webblänkar
Hittar och korrigerar automatiskt felstavade ord
100 % kompatibilitet med andra Aspose-produkter
Lätt att installera
Du kan använda Aspose.OCR för Java direkt från ett Maven- baserat projekt genom att följa enkla installationsinstruktioner .
Begär en tillfällig licens för att börja bygga en fullt fungerande OCR-applikation utan några begränsningar och restriktioner.
$Easy to Use$
Bildigenkänning kräver ett par rader kod. Bokstavligen. Det är verkligen så enkelt - prova själv:
Bild till text på 7 rader - Java
// Skapa instans av OCR API
AsposeOCR api = new AsposeOCR();
try {
// Känner igen bilden
String result = api.RecognizePage(imagePath);
// Visa igenkänningsresultatet
System.out.println("Recognized text: " + result);
} catch (IOException e) {
// Felhantering
e.printStackTrace();
}
26 igenkänningsspråk
OCR API stöder ett stort antal språk och alla populära skrivskript, inklusive texter med blandade språk. Den inbyggda stavningskontrollen ersätter automatiskt felstavade ord och sparar dig besväret att manuellt korrigera igenkänningsresultat.
- Utökat latinska alfabet : kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska.
- Kyrilliska alfabetet : vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska.
- Kinesiska : mer än 6 000 tecken.
Du kan ange språket för att öka igenkänningsprestandan och tillförlitligheten eller låta API:et upptäcka språk automatiskt.
Bevara formateringen
OCR API läser alla populära typsnitt som Arial, Times New Roman, Courier New, Tahoma, Calibri och mer i vanliga, fetstilta och kursiv stilar och bevarar noggrant formateringen i OCR-resultat. Du kan också dela upp igenkänningsresultat i rader och upptäcka textområden på en sida.
Känner igen foton
Skannern är inte alltid tillgänglig på slutanvändararbetsstationer, vilket kan bli en showstopper för OCR-applikationer. Vårt OCR API tillhandahåller ett antal förbehandlingsfilter som kan hantera förvrängda, roterade, sneda och brusiga bilder. I kombination med stöd för alla bildformat möjliggör det tillförlitlig igenkänning av även smartphonefoton. Det mesta av förbearbetningen och bildkorrigeringen sker automatiskt, men du kan alltid ingripa i svåra fall.
Använd bildkorrigeringar - Java
// Skapa instans av OCR API
AsposeOCR api = new AsposeOCR();
// Definiera förbehandlingsfilter
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Förbearbeta bilden före igenkänning
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Känner igen bilden
RecognitionResult result = api.RecognizePage(imageRes, set);
Prestandaoptimering
Optisk teckenigenkänning kräver mycket bearbetningsresurser, vilket kan bli ett problem för webbtjänster och enheter på nybörjarnivå. API:et erbjuder mycket flexibla sätt att balansera igenkänningshastighet, resurskrav och noggrannhet:
- Välj mellan grundlig igenkänning och snabb igenkänning.
- Ange antalet trådar som tilldelats för igenkänning, eller låt biblioteket automatiskt skala till antalet CPU-kärnor.
- Frigör CPU:n genom att ladda ner beräkningarna till GPU:n.
Snabb igenkänning - Java
// Skapa instans av OCR API
AsposeOCR api = new AsposeOCR();
// Känn igen bilden i det snabbaste läget
String result = api.RecognizePageFast("sample.jpg");
Satsvis bearbetning
OCR API befriar dig från att behöva känna igen varje bild en i taget genom att erbjuda olika batchbehandlingsmetoder som låter dig känna igen flera bilder i ett enda samtal:
- Igenkänning av flersidiga PDF- och TIFF-filer.
- Igenkänning av alla filer i ett arkiv.
- Igenkänning av alla filer i en mapp.
Support and Learning Resources
- Produktsupport
- Gratis support
- Betald support
- Blogg
- Release Notes
- Varför Aspose.OCR för Java?
- Kundlista
- Framgångsberättelser