Aspose.OCR  for .NET

Konvertálja a képeket és PDF-eket szöveggé a .NET-ben

Adjon hozzá optikai karakterfelismerést (OCR) .NET-alkalmazásaihoz néhány sor kóddal.

  Download Free Trial
  
 

Az Aspose.OCR for .NET egy hatékony, de könnyen használható és költséghatékony API az optikai karakterfelismeréshez. Ezzel kevesebb mint 5 sornyi kóddal OCR funkciókat adhat hozzá .NET-alkalmazásaihoz anélkül, hogy bonyolult matematikai, neurális hálózatok és egyéb technikai részletek miatt kellene aggódnia. Gépi tanulási technológiák terén szerzett tapasztalatunk és több éves fejlesztés eredményeképpen egy kiemelkedő sebességű és pontosságú OCR-motor született, amely 26 nyelvet támogat latin és cirill írásmódon, valamint kínaion . Az OCR API felismeri a beszkennelt képeket, okostelefonos fényképeket, képernyőképeket, képterületeket és beolvasott PDF-eket, és a legnépszerűbb dokumentum- és adatcsere-formátumokban adja vissza az eredményeket. A különféle előfeldolgozó szűrők lehetővé teszik az elforgatott, ferde és zajos képek felismerését. A felismerési teljesítmény és a rendszerterhelés tovább javítható az erőforrásigényes számítási feladatok GPU -ra való átvitelével.

Az Aspose.OCR szolgáltatásai és képességei .NET-hez

A képeket és a PDF-eket szöveggé alakítja

Támogatja az összes szkennerből vagy fényképezőgépből beszerezhető képformátumot

Latin és cirill alapú nyelveket olvas

Több mint 6000 kínai karaktert ismer fel

Érzékeli és felismeri az összes népszerű betűtípust

Gondosan megőrzi a betűstílusokat és a formázást

A teljes képet vagy csak a kiválasztott területeket dolgozza fel

Támogatja az elforgatott, ferde és zajos képeket

A mappában vagy archívumban lévő összes kép kötegelt felismerése

Felismeri a webes hivatkozásként megadott képeket

Megkeresi és automatikusan kijavítja a hibásan írt szavakat

Teljesen kompatibilis más Aspose termékekkel

Könnyen telepíthető

Az Aspose.OCR for .NET egyszerű NuGet-csomagként vagy letölthető fájlként kerül terjesztésre minimális függőséggel. Egyszerűen telepítse projektjére, és készen áll a szövegek felismerésére bármely támogatott nyelven, és a felismerési eredményeket a támogatott formátumok bármelyikén elmentheti.

Kérjen ideiglenes licencet egy teljesen működőképes OCR-alkalmazás korlátok és korlátozások nélküli felépítéséhez.

Könnyen kezelhető

Három sor kódra van szüksége a kép felismeréséhez és az eredmény megjelenítéséhez. Igen, ez tényleg ilyen egyszerű!

Kép szöveggé 3 sorban - C#

// Inicializálja az OCR motort
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Kép felismerése szöveggé
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Jelenítse meg a felismerés eredményét
Console.WriteLine(result);

Platformok közötti

A könyvtár teljes mértékben támogatja a .NET Standard 2.0-t. Ez azt jelenti, hogy az alkalmazások bármilyen platformon futhatnak: asztali Windows, Windows Server, macOS, Linux és felhő.

26 Felismerési nyelvek

Az OCR API számos nyelvet és minden népszerű írási szkriptet képes felismerni, beleértve a vegyes nyelvű szövegeket is.

  • Bővített latin ábécé : horvát, cseh, dán, holland, angol, észt, finn, francia, német, olasz, lett, litván, norvég, lengyel, portugál, román, szlovák, szlovén, spanyol, svéd.
  • Cirill ábécé : fehérorosz, bolgár, kazah, orosz, szerb, ukrán.
  • kínai : több mint 6000 karakter.

A nyelvészlelést a könyvtárra bízhatja, vagy saját maga határozhatja meg a nyelvet a felismerési teljesítmény és megbízhatóság növelése érdekében.

Fényképek felismerése

Az OCR-alkalmazások legnagyobb akadálya az, hogy a szkennerek nem mindennapiak a végfelhasználók számára. Az API hatékony beépített kép-előfeldolgozó szűrőkkel rendelkezik, amelyek képesek kezelni az elforgatott, ferde és zajos képeket. Az összes képformátum támogatásával együtt lehetővé teszi az okostelefonon készült fényképek megbízható felismerését is. Az előfeldolgozás és képjavítás nagy része automatikusan történik, így csak nehéz esetekben kell beavatkozni.

Automatikus képjavítás alkalmazása - C#

// Inicializálja az OCR motort
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Automatikus ferde számítás és kontraszt engedélyezése
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Kép felismerése
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Univerzális átalakító

Az API szó szerint bármilyen képet képes olvasni, amelyet szkennerről, fényképezőgépről vagy okostelefonról kap: PDF dokumentumokat, JPEG, PNG, TIFF, GIF, BMP képeket és még DjVu fájlokat is. A többoldalas PDF dokumentumok, a TIFF és a DjVu képek teljes mértékben támogatottak. URL-címen keresztül is megadhat képet az internetről.

A felismerési eredmények a legnépszerűbb dokumentum- és adatcsere-formátumokban jelennek meg: egyszerű szöveg, PDF, Microsoft Word, Microsoft Excel, JSON és XML.

A PDF felismerése és az eredmények mentése JSON-ba – C#

// Inicializálja az OCR motort
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// A beolvasott PDF összes oldalának felismerése
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Minden oldalt JSON-ként adja ki
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Erőforrás-optimalizálás

Az optikai karakterfelismerés erőforrásigényes folyamat. Az API nagyon rugalmas módokat kínál az egyensúly megteremtésére a klasszikus idő-ár-minőség hármasban:

  • Válasszon az alapos felismerés és a gyors felismerés között.
  • Adja meg a felismeréshez lefoglalt szálak számát, vagy engedélyezze a könyvtár számára, hogy automatikusan a processzormagok számához igazodjon.
  • Szabadítsa fel a CPU-t a számítások GPU-ra való feltöltésével.

Gyors felismerés - C#

// Inicializálja az OCR motort
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Kép felismerése a leggyorsabb módban
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Helyesírás-ellenőrzés

Míg az OCR megbízható eredményeket ad, a por és a nyomtatási hibák egyes szimbólumok helytelen felismerését okozhatják. Az OCR API beépített helyesírás-ellenőrzővel rendelkezik, amely automatikusan helyettesíti a hibásan írt szavakat, és megszabadítja a felismerési eredmények manuális javításától.

Helyesírás-ellenőrzés felismerési eredményei - C#

// Inicializálja az OCR motort
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Automatikus kontraszt engedélyezése
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Kép felismerése
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Javítsa ki az elírt szavakat
string text =  result.GetSpellCheckCorrectedText();

Kötegelt feldolgozás

Az OCR API megszabadítja Önt minden kép egyenkénti felismerésétől, mivel különféle kötegelt feldolgozási módszereket kínál, amelyek lehetővé teszik több kép felismerését egy hívás során:

  • Többoldalas PDF, TIFF és DjVu fájlok felismerése.
  • A mappában lévő összes fájl felismerése.
  • Az archívumban lévő összes fájl felismerése.
  • Az összes fájl felismerése egy listáról.

Tanulj példával

Az Aspose.OCR for .NET számos C# nyelven írt példát tartalmaz, amelyek lehetővé teszik, hogy gyorsan megismerkedjen a funkcióival és képességeivel, és ötletet adjon az üzleti igényeinek megfelelő megoldások létrehozásához.

  
  

Az Aspose natív OCR API-kat is kínál más népszerű programozási nyelvekhez: