Aspose.OCR  for Python via .NET

Optical character recognition API for Python

Szöveg kinyerése beolvasott képekből, fényképekből és képernyőképekből, kereshető PDF-fájlok létrehozása, szövegek keresése és összehasonlítása a képekben, és sok minden más a Python alkalmazásokból.

  Download Free Trial
  
 

Aspose.OCR for Python via .NET egy erőteljes, ugyanakkor könnyen használható optikai karakterfelismerő (OCR) motor Python-alkalmazásaihoz és notebookjaihoz. Kevesebb, mint 10 sornyi kóddal 28 nyelvű szöveget ismerhet fel latin, cirill és ázsiai betűk alapján, és a legnépszerűbb dokumentum- és adatcsere-formátumokban adja vissza az eredményeket. Nincs szükség bonyolult matematikai modellek megtanulására, gépi tanulási algoritmusok létrehozására és neurális hálózatok képzésére — egyszerű és robusztus API-nk mindent megtesz helyetted.

A könyvtár egyformán jól működik minden forrással, a kiváló minőségű szkenneléstől az okostelefonon készült gyors fényképig. Függetlenül attól, hogy a kép el van-e forgatva, torz vagy zajos — az automatikus elő- és utófeldolgozó szűrők a legnagyobb felismerési pontosságot biztosítják a legrövidebb idő alatt.

Jellemzők és képességek

Szöveg kinyerése beolvasásokból, fényképekből és képernyőképekből

A beolvasott PDF konvertálása kereshető és indexelhető PDF-ekké

Olvasson latin, cirill és ázsiai betűket minden népszerű betűtípussal

Több mint 6000 kínai karakter felismerése

Homályos, torz, elforgatott és zajos képekkel dolgozhat

Azonosítsa és őrizze meg a tartalomblokkokat az eredeti szövegelrendezésből

Egy kép területeinek észlelése és olvasása: bekezdések, sorok és egyes szavak

Többoldalas dokumentumok, mappák és archívumok tömeges feldolgozása

Képek felismerése az internetről letöltés nélkül

A hibásan írt szavak azonosítása és automatikus javítása

Keressen szöveget a képekben, és intelligensen hasonlítsa össze a képszövegeket

Könnyen kezelhető

Csak 5 sornyi kódra van szüksége a kép felismeréséhez és az eredmény megjelenítéséhez. Igen, ez tényleg ilyen egyszerű!

Felismerésre kész Felismerés Dobjon ide egy fájlt, vagy kattintson a böngészéshez *

* Fájlainak feltöltésével vagy a szolgáltatás használatával Ön egyetért velünk Felhasználási feltételek és Adatvédelmi irányelvek.

Élő kódminta - Python 3

# Inicializálja az OCR motort
recognitionEngine = AsposeOcr()
# Kép hozzáadása a köteghez
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Szöveg kibontása a képből
result = recognitionEngine.recognize(input)
# Jelenítse meg a felismerés eredményét
print(result[0].recognition_text)
Elismerés eredménye
 

28 felismerési nyelv

Az

Aspose.OCR for Python via .NET nagyszámú nyelvet és minden népszerű írási szkriptet képes felismerni, beleértve a vegyes nyelvű szövegeket is:

  • Bővített latin ábécé: horvát, cseh, dán, holland, angol (a kézírással együtt), észt, finn, francia, német, olasz, lett, litván, norvég, lengyel, portugál, román , szlovák, szlovén, spanyol, svéd.
  • Cirill ábécé: fehérorosz, bolgár, kazah, orosz, szerb, ukrán.
  • Kínai: több mint 6000 karakter.
  • hindi

Más nyelvű szövegeket is olvashat kibővített latinon és cirillen, még akkor is, ha azokat az OCR-motor közvetlenül nem támogatja. Például latin, vietnami, gael és így tovább.

Erőteljes feldolgozó szűrők

Az optikai karakterfelismerés pontossága és megbízhatósága nagymértékben függ az eredeti kép minőségétől. Az Aspose.OCR for Python via .NET számos teljesen automatizált és kézi képfeldolgozó szűrőt kínál, amelyek javítják a képet, mielőtt elküldenék az OCR motornak:

  • A vízszinteshez képest enyhe szögben igazított képek automatikus kiegyenesítése.
  • Manuálisan forgassa el az erősen ferde képeket.
  • Automatikusan távolítsa el a szennyeződéseket, foltokat, karcolásokat, tükröződéseket, nem kívánt színátmeneteket és egyéb zajokat.
  • A kép kontrasztjának automatikus beállítása.
  • A kép automatikus felnagyítása vagy manuális átméretezése.
  • Képek konvertálása fekete-fehér vagy szürkeárnyalatossá.
  • Informálja meg a képszíneket, hogy a világos területek sötétnek, a sötét területek pedig világosnak tűnjenek.
  • Növelje a karakterek vastagságát a képen.
  • A zajos képeket homályosítsa el, miközben megőrzi a betűk széleit.
  • Egyenesítse ki az oldal görbületét, és javítsa ki a kameralencse torzítását az oldalfotóknál.

Ezek a szűrők kombinálhatók és alkalmazhatók a teljes képre vagy csak a kép kiválasztott területeire, valamint kötegelt feldolgozás során. Nem csak finomhangolhatja az előfeldolgozást a felismerési folyamatban, hanem tárolhatja a feldolgozott képeket megjelenítéshez, gyorsítótárazáshoz és hibakereséshez.

Adott dokumentumtípusokhoz optimalizálva

Az

Aspose.OCR for Python via .NET speciálisan kiképzett neurális hálózatokat kínál, amelyek maximális pontossággal vonnak ki szöveget bizonyos típusú képekből:

  • Szkennelt vagy fényképezett személyi igazolványok és útlevelek.
  • Járművek rendszámai.
  • Számlák.
  • Nyugták.

Beépített helyesírás-ellenőrző

Bár az Aspose.OCR for Python via .NET nagy felismerési pontosságot biztosít, a nyomtatási hibák, a szennyeződés vagy a nem szabványos betűtípusok bizonyos karakterek vagy szavak helytelen felismerését okozhatják. A felismerési eredmények további javítása érdekében bekapcsolhatja a helyesírás-ellenőrzőt, amely megkeresi és automatikusan kijavítja a helyesírási hibákat a kiválasztott felismerési nyelv alapján.

Ha a felismert szöveg speciális terminológiát, rövidítéseket és egyéb olyan szavakat tartalmaz, amelyek nem szerepelnek a gyakori helyesírási szótárakban, megadhatja saját szólistáját.

Kereshető PDF-ek létrehozása

Még a legnagyobb felismerési pontossággal is előfordulhat, hogy az eredeti kép sok fontos, nem szöveges információt tartalmazhat, vagy egyszerűen csak nagy történelmi értékű lehet. Az Aspose.OCR for Python via .NET egyszerű és elegáns megoldást kínál a két világ legjavának ötvözésére. Képből, PDF dokumentumból vagy fájlcsomagból kivonjuk a szöveget, és láthatatlan szövegrétegként az eredeti képek tetejére helyezzük. Az eredmény PDF formátumban kerül mentésre, amely a dokumentumok tárolásának és megosztásának iparági szabványa. Az eredményül kapott fájlok kereshetők és indexelhetők, a szöveg pedig ugyanúgy kiválasztható és másolható, mintha az eredeti karaktereket választotta volna ki és másolta volna.

Tömeges felismerés

Az

Aspose.OCR for Python via .NET lehetővé teszi több fájl felismerését, számuktól és típusuktól függetlenül, olyan egyszerű, mint egyetlen kép elolvasása. Egyetlen API-hívással több oldalt felismerhet egy automatikus adagoló szkennerből, vagy kinyerheti a jármű rendszámait az automatikus forgalmi kamerákból.

Az eredmények elmenthetők kereshető PDF-dokumentumként vagy táblázatként, vagy visszaküldhetők egyszerű szövegként, JSON- vagy XML-fájlként további elemzés céljából.

  

Support and Learning Resources

  
  

Az Aspose natív OCR API-kat is kínál más népszerű programozási nyelvekhez: