Varför Aspose.OCR för Python via Java?

Aspose.OCR för Python via Java integrerar sömlöst kraftfulla funktioner för optisk teckenigenkänning (OCR) i dina plattformsoberoende Python-anteckningsböcker och applikationer. Med vårt intuitiva och höghastighets-API kan du enkelt extrahera text från skanningar, skärmdumpar, webblänkar eller smartphonefoton, vilket ger resultat som är redo för konsolidering, analys eller lagring. Känn igen skannade bilder, smartphonefoton, skärmdumpar och skannade PDF-filer och spara resultat i populära dokumentformat. Avancerade förbehandlingsfilter hanterar roterade, sneda och brusiga bilder. Optimera prestanda genom att ladda ner uppgifter till grafikprocessorn.

Illustration ocr

Snabb och exakt OCR

Uppnå höghastighets- och exakta OCR-resultat med vår avancerade Python via Java-teknik.

Flerspråkig support

Känn igen text på 28 språk, inklusive latinska, kyrilliska och kinesiska skript, vilket säkerställer mångsidighet för dina Python-applikationer via Java.

Flexibelt bildstöd

Bearbeta bilder från skannrar, kameror och smartphones sömlöst med Python via Java.

Precision i kinesisk teckenigenkänning

Känn igen över 6 000 kinesiska tecken med precision i dina Python-projekt via Java.

Bevara teckensnittsstilar och formatering

Behåll teckensnittsstilar och formatering för korrekt representation av igenkänd text i dina Python-applikationer via Java.

Live-kodexempel

Initiera textigenkänning från bilder på bara tre rader kod. Upplev enkelheten!

Redo att känna igen Redo att känna igen Släpp en fil här eller klicka för att bläddra *

* Genom att ladda upp dina filer eller använda tjänsten godkänner du vår Villkor och Integritetspolicy.

Erkännande resultat
 

Konvertera bild till text

Fler exempel >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Java Backend-kompatibilitet

Vårt bibliotek är designat som en Python-modul och säkerställer kompatibilitet mellan stora operativsystem som stöder Java - inklusive Microsoft Windows, Linux och macOS, eller molnplattformar. Detta gör att du kan utveckla applikationer på en plattform och sömlöst köra dem på en annan, vilket eliminerar behovet av kodändringar.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Filformat som stöds

Aspose.OCR for Python via Java kan fungera med praktiskt taget alla fil du kan få från en skanner eller kamera. Igenkänningsresultat returneras i de mest populära fil- och datautbytesformaten som kan sparas, importeras till en databas eller analyseras i realtid.

Bilder

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Batch OCR

  • Multi-page PDF
  • ZIP
  • Folder

Erkännande resultat

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Enkel installation för Python via Java

Aspose.OCR för Python via Java levereras som ett Python-paket eller som en nedladdningsbar fil med minimala beroenden. installera det enkelt i ditt projekt, och du är redo att känna igen texter på flera språk som stöds och spara igenkänningsresultat i olika format.

Begär en testlicens för att kickstarta utvecklingen av en fullt fungerande OCR-applikation utan begränsningar.

Kraftfull OCR för Python-applikationer

Vårt bibliotek integreras enkelt, vilket gör att Python-applikationer kan köras sömlöst på alla plattformar – stationära Windows, Windows Server, macOS, Linux och molnet.

28 igenkänningsspråk

Vårt Python och Java OCR API känner igen en uppsjö av språk och populära skriftskript, inklusive blandade språk:

Lämna språkdetektering till biblioteket eller definiera språket själv för förbättrad igenkänningsprestanda och tillförlitlighet.

  • Utökat latin alfabet: kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska;
  • kyrilliska alfabetet: vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska;
  • Kinesiska: Över 6 000 tecken;
  • Hindi.

Förbättrade bildbehandlingsfilter

Precisionen i optisk teckenigenkänning beror mycket på kvaliteten på originalbilden. Aspose.OCR för Python via Java erbjuder ett brett utbud av både automatiserade och manuella bildbehandlingsfilter för att optimera en bild innan den skickas till OCR-motorn:

  • Räta automatiskt lätt lutade bilder.
  • Korrigera rotationen manuellt för kraftigt sneda bilder.
  • Ta automatiskt bort smuts, fläckar, repor, bländning, oönskade gradienter och andra typer av ljud.
  • Justera bildkontrasten automatiskt.
  • Uppskala eller ändra storlek på bilden automatiskt.
  • Konvertera bilder till svartvitt eller gråskala.
  • Invertera bildfärgerna så att ljusa områden ser mörka ut och mörka områden ljusa.
  • Öka tjockleken på tecken i en bild.
  • Sudda ut brusiga bilder samtidigt som bokstäverna bevaras.
  • Räta ut sidans skevhet och korrigera kameralinsens förvrängning i sidfoton.

Specialiserade API:er för olika dokumenttyper

Aspose.OCR för Python via Java erbjuder specialtränade neurala nätverk för att extrahera text från vissa typer av bilder med maximal noggrannhet:

  • Skannade eller fotograferade ID-kort och pass.
  • Bilens registreringsskyltar.
  • Fakturor.
  • Kvitton.

Inbyggd stavningskontroll

Även om Aspose.OCR för Python via Java ger hög igenkänningsnoggrannhet, kan utskriftsdefekter, smuts eller icke-standardiserade teckensnitt göra att vissa tecken eller ord identifieras felaktigt. För att ytterligare förbättra igenkänningsresultaten kan du aktivera stavningskontrollen, som hittar och automatiskt korrigerar stavfel baserat på det valda igenkänningsspråket.

Om den erkända texten innehåller specialiserad terminologi, förkortningar och andra ord som inte finns i vanliga stavningsordböcker, kan du tillhandahålla dina egna ordlistor.

Effektiv batchigenkänning

Vårt Python OCR API ger dig möjlighet att effektivisera bildigenkänningen. Använd mångsidiga batch-bearbetningsmetoder för effektiv bearbetning av flera bilder i ett enda samtal:

  • Känn igen flersidiga PDF-, TIFF-filer.
  • Bearbeta alla filer i en mapp.
  • Hantera igenkänning för alla filer i ett arkiv.
  • Känn igen bilder från en specificerad lista.

Lärande via Python-exempel

Utforska en mängd olika Python-exempel som är utformade för att hjälpa dig att snabbt förstå funktionerna och kapaciteten hos vår OCR-lösning. Få snabbt insikt i att skapa skräddarsydda lösningar som uppfyller dina specifika affärskrav.

Funktioner och funktioner

Aspose.OCR for Python via Java Utforska de avancerade funktionerna i Aspose.OCR för Python

Feature icon

Foto OCR

Extrahera text från smartphonefoton med noggrannhet på skanningsnivå.

Feature icon

Sökbar PDF

Konvertera vilken skanning som helst till ett helt sökbart och indexerbart dokument.

Feature icon

URL-igenkänning

Känn igen en bild från URL utan att ladda ner den lokalt.

Feature icon

Bulkigenkänning

Läs alla bilder från flersidiga dokument, mappar och arkiv.

Feature icon

Alla typsnitt och stilar

Identifiera och känna igen text i alla populära typsnitt och stilar.

Feature icon

Finjustera igenkänning

Justera varje OCR-parameter för bästa igenkänningsresultat.

Feature icon

Stavningskontroll

Förbättra resultaten genom att automatiskt korrigera felstavade ord.

Feature icon

Hitta text i bilder

Sök efter text eller reguljärt uttryck i en uppsättning bilder.

Feature icon

Jämför bildtexter

Jämför texter på två bilder, oavsett fall och layout.

Python-kodprov

Upptäck kodexempel för att sömlöst integrera Aspose.OCR för Python via Java i dina applikationer.

Enkel installation

Som ett Python-paket eller en nedladdningsbar fil med minimala beroenden säkerställer Aspose.OCR för Python via Java enkel distribution. Integrera det i ditt projekt direkt från Python, och du är beredd att utnyttja kompletta OCR-funktioner och spara igenkänningsresultat i olika format.

Efter installationen, börja omedelbart använda Aspose.OCR för Python via Java, om än med vissa begränsningar. En tillfällig licens tar bort alla testversionsbegränsningar i 30 dagar. Använd denna period för att initiera utvecklingen av en fullt fungerande OCR-applikation, så att du kan fatta ett välgrundat beslut om att köpa Aspose.OCR för Python via Java senare.

Ladda licens

lic = License()
lic.set_license(self.licPath)

Bildigenkänning

Den primära utmaningen i OCR-applikationer är bristen på skannrar för slutanvändare. Vårt API, sömlöst integrerat med Python via Java, har robusta inbyggda bildförbehandlingsfilter som hanterar roterade, sneda och brusiga bilder. I kombination med stöd för alla bildformat möjliggör den pålitlig igenkänning, även från smartphonefoton. De flesta förbehandlingar och bildkorrigeringar är automatiserade, vilket kräver din inblandning endast i utmanande fall.

Tillämpa automatiska bildkorrigeringar - Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Python Universal Converter

Vårt API läser på ett skickligt sätt alla bilder från skannrar, kameror eller smartphones: PDF-dokument, JPEG, PNG, TIFF, GIF, BMP-filer. Fullt stöd för flersidiga PDF-dokument, TIFF och DjVu-bilder säkerställer mångsidighet. Du kan också tillhandahålla en bild från webben via en URL.

Igenkänningsresultat returneras i populära dokument- och datautbytesformat: vanlig text, PDF, Microsoft Word, Microsoft Excel, JSON och XML.

Känn igen PDF och spara resultat i olika utdataformat - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Optimera resursanvändning

OCR erbjuder en speciell igenkänningsalgoritm för att extrahera innehåll från bilder med gles text och bullriga/färgade bakgrunder. Denna metod förbättrar OCR-noggrannheten avsevärt i följande affärsfall:

  • Läs text från gatubilder.
  • Segmentera och identifiera vägskyltar och skyltar i gatubilder.
  • Leta upp prislappar och tolka den extraherade texten som priser.
  • Hitta och samla regioner av intresse på livsmedelsetiketter, till exempel näringsinformation eller ingredienslistor.
  • Identifiera och analysera bilskyltar.
  • Extrahera text från menyer och kataloger.

Öppet område OCR - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Extrahera text från gatufoton

OCR för Python erbjuder en speciell igenkänningsalgoritm som extraherar text från fordonets registreringsskyltar, inklusive mörka och suddiga bilder. Den resulterande texten kan sedan automatiskt sparas i databasen eller automatiskt verifieras.

Känn igen bilnummer - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)