Převeďte obrázky a PDF na text v .NET
Přidejte do svých aplikací .NET pomocí několika řádků kódu optické rozpoznávání znaků (OCR).
Download Free TrialAspose.OCR for .NET je výkonné, ale snadno použitelné a cenově výhodné API pro optické rozpoznávání znaků. S ním můžete do svých aplikací .NET přidat funkce OCR v méně než 5 řádcích kódu, aniž byste se museli starat o složitou matematiku, neuronové sítě a další technické detaily. Naše zkušenosti s technologiemi strojového učení a roky vývoje vyústily v OCR engine s vynikající rychlostí a přesností, který podporuje 26 jazyků založených na latince a cyrilici a také čínštinu . OCR API dokáže rozpoznat naskenované obrázky, fotografie smartphonu, snímky obrazovky, oblasti obrázků a naskenované soubory PDF a vrátit výsledky v nejoblíbenějších formátech pro výměnu dokumentů a dat. Různé filtry předběžného zpracování umožňují rozpoznat otočené, zkosené a zašuměné obrázky. Výkon rozpoznávání a zatížení systému lze dále zlepšit přenesením výpočetních úloh náročných na zdroje na GPU .
Vlastnosti a možnosti Aspose.OCR pro .NET
Převádí obrázky a soubory PDF na text
Podporuje všechny obrazové formáty, které můžete získat ze skeneru nebo fotoaparátu
Čte jazyky založené na latince a azbuce
Rozpozná více než 6000 čínských znaků
Detekuje a rozpoznává všechny oblíbené typy písma
Pečlivě zachovává styly písma a formátování
Zpracuje celý snímek nebo pouze vybrané oblasti
Podporuje otočené, zkosené a zašuměné obrázky
Dávkové rozpoznání všech obrázků ve složce nebo archivu
Rozpozná obrázky poskytnuté jako webové odkazy
Vyhledá a automaticky opraví chybně napsaná slova
Plně kompatibilní s ostatními produkty Aspose
Snadná instalace
Aspose.OCR for .NET je distribuován jako odlehčený balíček NuGet nebo jako soubor ke stažení s minimálními závislostmi. Jednoduše jej nainstalujte do svého projektu a jste připraveni rozpoznávat texty ve všech podporovaných jazycích a ukládat výsledky rozpoznávání v jakémkoli z podporovaných formátů.
Požádejte o dočasnou licenci , abyste mohli začít budovat plně funkční OCR aplikaci bez jakýchkoli omezení a omezení.
Snadné použití
K rozpoznání obrázku a zobrazení výsledku potřebujete tři řádky kódu. Ano, opravdu je to tak jednoduché!
Obrázek na text ve 3 řádcích - C#
// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Rozpoznat obrázek na text
string result = recognitionEngine.RecognizeImage("sample.jpg");
// Zobrazit výsledek rozpoznání
Console.WriteLine(result);
Víceplatformní
Knihovna plně podporuje .NET Standard 2.0. To znamená, že aplikace mohou běžet na jakékoli platformě: stolní Windows, Windows Server, macOS, Linux a cloud.
26 Rozpoznávací jazyky
OCR API dokáže rozpoznat velké množství jazyků a všechny populární psací skripty, včetně textů se smíšenými jazyky.
- Rozšířená latinská abeceda : chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština.
- Azbuka : běloruská, bulharská, kazašská, ruská, srbská, ukrajinská.
- Čínština : více než 6 000 znaků.
Detekci jazyka můžete nechat na knihovně nebo si jazyk definovat sami, abyste zvýšili výkon a spolehlivost rozpoznávání.
Rozpoznat fotografie
Největší překážkou OCR aplikací je, že skenery nejsou pro koncové uživatele samozřejmostí. API má vestavěné výkonné filtry pro předběžné zpracování obrázků, které si poradí s otočenými, zkosenými a zašuměnými obrázky. V kombinaci s podporou všech obrazových formátů umožňuje spolehlivé rozpoznání i fotografií z chytrého telefonu. Většina předzpracování a korekce obrazu probíhá automaticky, takže zasahovat budete muset jen v obtížných případech.
Použít automatické opravy obrázků - C#
// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Povolit automatický výpočet zkreslení a kontrastu
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true,
AutoSkew = true
};
// Rozpoznat obrázek
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("IMG_20220622_163123.jpg", recognitionSettings);
Univerzální převodník
Rozhraní API dokáže přečíst doslova jakýkoli obrázek, který získáte ze skeneru, fotoaparátu nebo smartphonu: dokumenty PDF, JPEG, PNG, TIFF, GIF, BMP a dokonce i soubory DjVu. Vícestránkové dokumenty PDF, obrázky TIFF a DjVu jsou plně podporovány. Můžete také poskytnout obrázek z webu prostřednictvím adresy URL.
Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu dokumentů a dat: prostý text, PDF, Microsoft Word, Microsoft Excel, JSON a XML.
Rozpoznat PDF a uložit výsledky do JSON - C#
// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Rozpozná všechny stránky z naskenovaného PDF
var pages = recognitionEngine.RecognizePdf("sample.pdf", new Aspose.OCR.DocumentRecognitionSettings());
// Výstup každé stránky jako JSON
foreach(var page in pages)
{
Console.WriteLine(page.GetJson());
}
Optimalizace zdrojů
Optické rozpoznávání znaků je proces náročný na zdroje. API nabízí velmi flexibilní způsoby, jak dosáhnout rovnováhy v klasické triádě čas-cena-kvalita:
- Vyberte si mezi důkladným rozpoznáním a rychlým rozpoznáním.
- Zadejte počet vláken přidělených pro rozpoznávání nebo povolte knihovně automaticky se škálovat podle počtu jader procesoru.
- Uvolněte CPU přenesením výpočtů na GPU.
Rychlé rozpoznání - C#
// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Rozpoznejte obraz v nejrychlejším režimu
string result = recognitionEngine.RecognizeImageFast("sample.jpg");
Kontrola pravopisu
Zatímco OCR poskytuje spolehlivé výsledky, prach a vady tisku mohou způsobit nesprávné rozpoznání některých symbolů. OCR API má vestavěnou kontrolu pravopisu, která automaticky nahrazuje chybně napsaná slova a zbavuje vás nutnosti ručně opravovat výsledky rozpoznávání.
Výsledky rozpoznávání pravopisu - C#
// Inicializujte OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Povolit automatický kontrast
var recognitionEngine = new Aspose.OCR.AsposeOcr();
var recognitionSettings = new Aspose.OCR.RecognitionSettings() {
AutoContrast = true
};
// Rozpoznat obrázek
Aspose.OCR.RecognitionResult result = recognitionEngine.RecognizeImage("sample.jpg", recognitionSettings);
// Opravte chybně napsaná slova
string text = result.GetSpellCheckCorrectedText();
Dávkové zpracování
OCR API vás osvobodí od rozpoznávání každého obrázku jeden po druhém tím, že nabízí různé metody dávkového zpracování, které vám umožní rozpoznat více obrázků v jednom volání:
- Rozpoznávání vícestránkových souborů PDF, TIFF a DjVu.
- Rozpoznávání všech souborů ve složce.
- Rozpoznávání všech souborů v archivu.
- Rozpoznání všech souborů ze seznamu.
Učte se příkladem
Aspose.OCR for .NET přichází s řadou příkladů napsaných v C#, které vám umožní rychle se seznámit s jeho funkcemi a možnostmi a poskytnou vám představu o vytváření řešení pro vaše obchodní potřeby.
Support and Learning Resources
- Výukové zdroje
- Dokumentace
- Zdrojový kód
- Reference API
- Výuková videa
- Podpora produktu
- Bezplatná podpora
- Placená podpora
- Blog
- Poznámky k vydání
- Proč Aspose.OCR pro .NET?
- Seznam zákazníků
- Příběhy úspěchu