Aspose.OCR  for .NET

Převeďte obrázky a PDF na text v .NET

Přidejte do svých aplikací .NET pomocí několika řádků kódu optické rozpoznávání znaků (OCR).

  Download Free Trial
  
 

Aspose.OCR for .NET je výkonné, ale snadno použitelné a cenově výhodné API pro optické rozpoznávání znaků. S ním můžete do svých aplikací .NET přidat funkce OCR v méně než 5 řádcích kódu, aniž byste se museli starat o složitou matematiku, neuronové sítě a další technické detaily. Naše zkušenosti s technologiemi strojového učení a roky vývoje vyústily v OCR engine s vynikající rychlostí a přesností, který podporuje 26 jazyků založených na latince a cyrilici a také čínštinu . OCR API dokáže rozpoznat naskenované obrázky, fotografie smartphonu, snímky obrazovky, oblasti obrázků a naskenované soubory PDF a vrátit výsledky v nejoblíbenějších formátech pro výměnu dokumentů a dat. Různé filtry předběžného zpracování umožňují rozpoznat otočené, zkosené a zašuměné obrázky. Výkon rozpoznávání a zatížení systému lze dále zlepšit přenesením výpočetních úloh náročných na zdroje na GPU .

Vlastnosti a možnosti Aspose.OCR pro .NET

Převádí obrázky a soubory PDF na text

Podporuje všechny obrazové formáty, které můžete získat ze skeneru nebo fotoaparátu

Čte jazyky založené na latince a azbuce

Rozpozná více než 6000 čínských znaků

Detekuje a rozpoznává všechny oblíbené typy písma

Pečlivě zachovává styly písma a formátování

Zpracuje celý snímek nebo pouze vybrané oblasti

Podporuje otočené, zkosené a zašuměné obrázky

Dávkové rozpoznání všech obrázků ve složce nebo archivu

Rozpozná obrázky poskytnuté jako webové odkazy

Vyhledá a automaticky opraví chybně napsaná slova

Plně kompatibilní s ostatními produkty Aspose

Snadná instalace

Aspose.OCR for .NET je distribuován jako odlehčený balíček NuGet nebo jako soubor ke stažení s minimálními závislostmi. Jednoduše jej nainstalujte do svého projektu a jste připraveni rozpoznávat texty ve všech podporovaných jazycích a ukládat výsledky rozpoznávání v jakémkoli z podporovaných formátů.

Požádejte o dočasnou licenci , abyste mohli začít budovat plně funkční OCR aplikaci bez jakýchkoli omezení a omezení.

Snadné použití

K rozpoznání obrázku a zobrazení výsledku potřebujete tři řádky kódu. Ano, opravdu je to tak jednoduché!

Obrázek na text ve 3 řádcích - C#

// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Rozpoznat obrázek na text
string result = recognitionEngine.RecognizeImage("sample.jpg");

// Zobrazit výsledek rozpoznání
Console.WriteLine(result);

Víceplatformní

Knihovna plně podporuje .NET Standard 2.0. To znamená, že aplikace mohou běžet na jakékoli platformě: stolní Windows, Windows Server, macOS, Linux a cloud.

26 Rozpoznávací jazyky

OCR API dokáže rozpoznat velké množství jazyků a všechny populární psací skripty, včetně textů se smíšenými jazyky.

  • Rozšířená latinská abeceda : chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština.
  • Azbuka : běloruská, bulharská, kazašská, ruská, srbská, ukrajinská.
  • Čínština : více než 6 000 znaků.

Detekci jazyka můžete nechat na knihovně nebo si jazyk definovat sami, abyste zvýšili výkon a spolehlivost rozpoznávání.

Rozpoznat fotografie

Největší překážkou OCR aplikací je, že skenery nejsou pro koncové uživatele samozřejmostí. API má vestavěné výkonné filtry pro předběžné zpracování obrázků, které si poradí s otočenými, zkosenými a zašuměnými obrázky. V kombinaci s podporou všech obrazových formátů umožňuje spolehlivé rozpoznání i fotografií z chytrého telefonu. Většina předzpracování a korekce obrazu probíhá automaticky, takže zasahovat budete muset jen v obtížných případech.

Použít automatické opravy obrázků - C#

// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Povolit automatický výpočet zkreslení a kontrastu
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true,
    AutoSkew = true
};

// Rozpoznat obrázek
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);

Univerzální převodník

Rozhraní API dokáže přečíst doslova jakýkoli obrázek, který získáte ze skeneru, fotoaparátu nebo smartphonu: dokumenty PDF, JPEG, PNG, TIFF, GIF, BMP a dokonce i soubory DjVu. Vícestránkové dokumenty PDF, obrázky TIFF a DjVu jsou plně podporovány. Můžete také poskytnout obrázek z webu prostřednictvím adresy URL.

Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu dokumentů a dat: prostý text, PDF, Microsoft Word, Microsoft Excel, JSON a XML.

Rozpoznat PDF a uložit výsledky do JSON - C#

// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Rozpozná všechny stránky z naskenovaného PDF
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());

// Výstup každé stránky jako JSON
foreach(var page in pages)
{
    Console.WriteLine(page.GetJson());
}

Optimalizace zdrojů

Optické rozpoznávání znaků je proces náročný na zdroje. API nabízí velmi flexibilní způsoby, jak dosáhnout rovnováhy v klasické triádě čas-cena-kvalita:

  • Vyberte si mezi důkladným rozpoznáním a rychlým rozpoznáním.
  • Zadejte počet vláken přidělených pro rozpoznávání nebo povolte knihovně automaticky se škálovat podle počtu jader procesoru.
  • Uvolněte CPU přenesením výpočtů na GPU.

Rychlé rozpoznání - C#

// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Rozpoznejte obraz v nejrychlejším režimu
string result = recognitionEngine.RecognizeImageFast("sample.jpg");

Kontrola pravopisu

Zatímco OCR poskytuje spolehlivé výsledky, prach a vady tisku mohou způsobit nesprávné rozpoznání některých symbolů. OCR API má vestavěnou kontrolu pravopisu, která automaticky nahrazuje chybně napsaná slova a zbavuje vás nutnosti ručně opravovat výsledky rozpoznávání.

Výsledky rozpoznávání pravopisu - C#

// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();

// Povolit automatický kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
    AutoContrast = true
};

// Rozpoznat obrázek
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);

// Opravte chybně napsaná slova
string text =  result.GetSpellCheckCorrectedText();

Dávkové zpracování

OCR API vás osvobodí od rozpoznávání každého obrázku jeden po druhém tím, že nabízí různé metody dávkového zpracování, které vám umožní rozpoznat více obrázků v jednom volání:

  • Rozpoznávání vícestránkových souborů PDF, TIFF a DjVu.
  • Rozpoznávání všech souborů ve složce.
  • Rozpoznávání všech souborů v archivu.
  • Rozpoznání všech souborů ze seznamu.

Učte se příkladem

Aspose.OCR for .NET přichází s řadou příkladů napsaných v C#, které vám umožní rychle se seznámit s jeho funkcemi a možnostmi a poskytnou vám představu o vytváření řešení pro vaše obchodní potřeby.

  
  

Aspose také nabízí nativní rozhraní OCR API pro další oblíbené programovací jazyky: