OCR Mastery in Python: Drivs av Aspose.OCR för Python via .NET
Känna igen text i bilder med Python
Fler montrar ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Varför Aspose.OCR för Python via Java?
Aspose.OCR för Python via Java integrerar sömlöst kraftfulla funktioner för optisk teckenigenkänning (OCR) i dina plattformsoberoende Python-anteckningsböcker och applikationer. Med vårt intuitiva och höghastighets-API kan du enkelt extrahera text från skanningar, skärmdumpar, webblänkar eller smartphonefoton, vilket ger resultat som är redo för konsolidering, analys eller lagring. Känn igen skannade bilder, smartphonefoton, skärmdumpar och skannade PDF-filer och spara resultat i populära dokumentformat. Avancerade förbehandlingsfilter hanterar roterade, sneda och brusiga bilder. Optimera prestanda genom att ladda ner uppgifter till grafikprocessorn.
Snabb och exakt OCR
Uppnå höghastighets- och exakta OCR-resultat med vår avancerade Python via Java-teknik.
Flerspråkig support
Känn igen text på 28 språk, inklusive latinska, kyrilliska och kinesiska skript, vilket säkerställer mångsidighet för dina Python-applikationer via Java.
Flexibelt bildstöd
Bearbeta bilder från skannrar, kameror och smartphones sömlöst med Python via Java.
Precision i kinesisk teckenigenkänning
Känn igen över 6 000 kinesiska tecken med precision i dina Python-projekt via Java.
Bevara teckensnittsstilar och formatering
Behåll teckensnittsstilar och formatering för korrekt representation av igenkänd text i dina Python-applikationer via Java.
Live-kodexempel
Initiera textigenkänning från bilder på bara tre rader kod. Upplev enkelheten!
* Genom att ladda upp dina filer eller använda tjänsten godkänner du vår Villkor och Integritetspolicy.
Konvertera bild till text
Fler exempel ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Java Backend-kompatibilitet
Vårt bibliotek är designat som en Python-modul och säkerställer kompatibilitet mellan stora operativsystem som stöder Java - inklusive Microsoft Windows, Linux och macOS, eller molnplattformar. Detta gör att du kan utveckla applikationer på en plattform och sömlöst köra dem på en annan, vilket eliminerar behovet av kodändringar.
Filformat som stöds
Aspose.OCR for Python via Java kan fungera med praktiskt taget alla fil du kan få från en skanner eller kamera. Igenkänningsresultat returneras i de mest populära fil- och datautbytesformaten som kan sparas, importeras till en databas eller analyseras i realtid.
Bilder
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Batch OCR
- Multi-page PDF
- ZIP
- Folder
Erkännande resultat
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Enkel installation för Python via Java
Aspose.OCR för Python via Java levereras som ett Python-paket eller som en nedladdningsbar fil med minimala beroenden. installera det enkelt i ditt projekt, och du är redo att känna igen texter på flera språk som stöds och spara igenkänningsresultat i olika format.
Begär en testlicens för att kickstarta utvecklingen av en fullt fungerande OCR-applikation utan begränsningar.
Kraftfull OCR för Python-applikationer
Vårt bibliotek integreras enkelt, vilket gör att Python-applikationer kan köras sömlöst på alla plattformar – stationära Windows, Windows Server, macOS, Linux och molnet.
28 igenkänningsspråk
Vårt Python och Java OCR API känner igen en uppsjö av språk och populära skriftskript, inklusive blandade språk:
Lämna språkdetektering till biblioteket eller definiera språket själv för förbättrad igenkänningsprestanda och tillförlitlighet.
- Utökat latin alfabet: kroatiska, tjeckiska, danska, holländska, engelska, estniska, finska, franska, tyska, italienska, lettiska, litauiska, norska, polska, portugisiska, rumänska, slovakiska, slovenska, spanska, svenska;
- kyrilliska alfabetet: vitryska, bulgariska, kazakiska, ryska, serbiska, ukrainska;
- Kinesiska: Över 6 000 tecken;
- Hindi.
Förbättrade bildbehandlingsfilter
Precisionen i optisk teckenigenkänning beror mycket på kvaliteten på originalbilden. Aspose.OCR för Python via Java erbjuder ett brett utbud av både automatiserade och manuella bildbehandlingsfilter för att optimera en bild innan den skickas till OCR-motorn:
- Räta automatiskt lätt lutade bilder.
- Korrigera rotationen manuellt för kraftigt sneda bilder.
- Ta automatiskt bort smuts, fläckar, repor, bländning, oönskade gradienter och andra typer av ljud.
- Justera bildkontrasten automatiskt.
- Uppskala eller ändra storlek på bilden automatiskt.
- Konvertera bilder till svartvitt eller gråskala.
- Invertera bildfärgerna så att ljusa områden ser mörka ut och mörka områden ljusa.
- Öka tjockleken på tecken i en bild.
- Sudda ut brusiga bilder samtidigt som bokstäverna bevaras.
- Räta ut sidans skevhet och korrigera kameralinsens förvrängning i sidfoton.
Specialiserade API:er för olika dokumenttyper
Aspose.OCR för Python via Java erbjuder specialtränade neurala nätverk för att extrahera text från vissa typer av bilder med maximal noggrannhet:
- Skannade eller fotograferade ID-kort och pass.
- Bilens registreringsskyltar.
- Fakturor.
- Kvitton.
Inbyggd stavningskontroll
Även om Aspose.OCR för Python via Java ger hög igenkänningsnoggrannhet, kan utskriftsdefekter, smuts eller icke-standardiserade teckensnitt göra att vissa tecken eller ord identifieras felaktigt. För att ytterligare förbättra igenkänningsresultaten kan du aktivera stavningskontrollen, som hittar och automatiskt korrigerar stavfel baserat på det valda igenkänningsspråket.
Om den erkända texten innehåller specialiserad terminologi, förkortningar och andra ord som inte finns i vanliga stavningsordböcker, kan du tillhandahålla dina egna ordlistor.
Effektiv batchigenkänning
Vårt Python OCR API ger dig möjlighet att effektivisera bildigenkänningen. Använd mångsidiga batch-bearbetningsmetoder för effektiv bearbetning av flera bilder i ett enda samtal:
- Känn igen flersidiga PDF-, TIFF-filer.
- Bearbeta alla filer i en mapp.
- Hantera igenkänning för alla filer i ett arkiv.
- Känn igen bilder från en specificerad lista.
Lärande via Python-exempel
Utforska en mängd olika Python-exempel som är utformade för att hjälpa dig att snabbt förstå funktionerna och kapaciteten hos vår OCR-lösning. Få snabbt insikt i att skapa skräddarsydda lösningar som uppfyller dina specifika affärskrav.
Funktioner och funktioner
Aspose.OCR for Python via Java Utforska de avancerade funktionerna i Aspose.OCR för Python
Foto OCR
Extrahera text från smartphonefoton med noggrannhet på skanningsnivå.
Sökbar PDF
Konvertera vilken skanning som helst till ett helt sökbart och indexerbart dokument.
URL-igenkänning
Känn igen en bild från URL utan att ladda ner den lokalt.
Bulkigenkänning
Läs alla bilder från flersidiga dokument, mappar och arkiv.
Alla typsnitt och stilar
Identifiera och känna igen text i alla populära typsnitt och stilar.
Finjustera igenkänning
Justera varje OCR-parameter för bästa igenkänningsresultat.
Stavningskontroll
Förbättra resultaten genom att automatiskt korrigera felstavade ord.
Hitta text i bilder
Sök efter text eller reguljärt uttryck i en uppsättning bilder.
Jämför bildtexter
Jämför texter på två bilder, oavsett fall och layout.
Python-kodprov
Upptäck kodexempel för att sömlöst integrera Aspose.OCR för Python via Java i dina applikationer.
Enkel installation
Som ett Python-paket eller en nedladdningsbar fil med minimala beroenden säkerställer Aspose.OCR för Python via Java enkel distribution. Integrera det i ditt projekt direkt från Python, och du är beredd att utnyttja kompletta OCR-funktioner och spara igenkänningsresultat i olika format.
Efter installationen, börja omedelbart använda Aspose.OCR för Python via Java, om än med vissa begränsningar. En tillfällig licens tar bort alla testversionsbegränsningar i 30 dagar. Använd denna period för att initiera utvecklingen av en fullt fungerande OCR-applikation, så att du kan fatta ett välgrundat beslut om att köpa Aspose.OCR för Python via Java senare.
Ladda licens
lic = License()
lic.set_license(self.licPath)
Bildigenkänning
Den primära utmaningen i OCR-applikationer är bristen på skannrar för slutanvändare. Vårt API, sömlöst integrerat med Python via Java, har robusta inbyggda bildförbehandlingsfilter som hanterar roterade, sneda och brusiga bilder. I kombination med stöd för alla bildformat möjliggör den pålitlig igenkänning, även från smartphonefoton. De flesta förbehandlingar och bildkorrigeringar är automatiserade, vilket kräver din inblandning endast i utmanande fall.
Tillämpa automatiska bildkorrigeringar - Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Python Universal Converter
Vårt API läser på ett skickligt sätt alla bilder från skannrar, kameror eller smartphones: PDF-dokument, JPEG, PNG, TIFF, GIF, BMP-filer. Fullt stöd för flersidiga PDF-dokument, TIFF och DjVu-bilder säkerställer mångsidighet. Du kan också tillhandahålla en bild från webben via en URL.
Igenkänningsresultat returneras i populära dokument- och datautbytesformat: vanlig text, PDF, Microsoft Word, Microsoft Excel, JSON och XML.
Känn igen PDF och spara resultat i olika utdataformat - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Optimera resursanvändning
OCR erbjuder en speciell igenkänningsalgoritm för att extrahera innehåll från bilder med gles text och bullriga/färgade bakgrunder. Denna metod förbättrar OCR-noggrannheten avsevärt i följande affärsfall:
- Läs text från gatubilder.
- Segmentera och identifiera vägskyltar och skyltar i gatubilder.
- Leta upp prislappar och tolka den extraherade texten som priser.
- Hitta och samla regioner av intresse på livsmedelsetiketter, till exempel näringsinformation eller ingredienslistor.
- Identifiera och analysera bilskyltar.
- Extrahera text från menyer och kataloger.
Öppet område OCR - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Extrahera text från gatufoton
OCR för Python erbjuder en speciell igenkänningsalgoritm som extraherar text från fordonets registreringsskyltar, inklusive mörka och suddiga bilder. Den resulterande texten kan sedan automatiskt sparas i databasen eller automatiskt verifieras.
Känn igen bilnummer - Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)