Proč Aspose.OCR pro .NET?

Aspose.OCR for .NET je robustní, pro vývojáře přívětivé a cenově výhodné API pro optické rozpoznávání znaků. V méně než 10 řádcích nativního kódu C# můžete zabudovat možnosti OCR do svých desktopových řešení .NET, webových aplikací založených na MVC, cloudových služeb a funkcí Azure bez serveru. Extrahujte strojově čitelný text ze skenů, fotografií a snímků obrazovky, převádějte naskenované stránky do prohledávatelných a indexovatelných PDF, najděte a porovnejte text na obrázcích se zaměřením na obchodní úkol spíše než na složitou matematiku, neuronové sítě a další technické složitosti. Kliknutím na položky níže se dozvíte více o našich funkcích a výhodách.

Illustration ocr

Globální aplikace

Rozpozná texty v latince, azbuce a asijských písmech, včetně více než 6 000 čínských znaků a hindštiny.

Přečtěte si vše

Získejte text z libovolného souboru získaného pomocí skeneru nebo fotoaparátu a zpracujte obrázky přímo z webových odkazů.

Spolehlivé výsledky

Dosáhněte vysoké přesnosti rozpoznávání všech obrázků, včetně těch, které jsou neostré, otočené, zkreslené a zašuměné.

Rozpoznávání dávky

Hromadně rozpoznat všechny obrázky ze složek a archivů; číst vícestránkové dokumenty PDF a obrázky TIFF.

Detekce rozložení

Identifikujte a kategorizujte bloky obsahu v obrázcích, abyste zajistili správné pořadí extrahovaného textu bez ohledu na rozvržení.

Ukázka živého kódu

Optické rozpoznávání znaků se s Aspose.OCR stává triviálním a přímočarým úkolem, a to i pro vývojáře, kteří s touto technologií začínají. K extrahování textu z obrázku a jeho zobrazení na obrazovce stačí jen pár řádků kódu. Je to opravdu tak jednoduché - zkuste to.

Připraveno k rozpoznání Připraveno k rozpoznání Sem přetáhněte soubor nebo kliknutím procházejte *

* Nahráním souborů nebo používáním služby souhlasíte s našimi Podmínky použití a Zásady ochrany osobních údajů.

Výsledek uznání
 

Převést obrázek na text

Další příklady >
// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");

// Perform OCR
List<Aspose.OCR.RecognitionResult> results
     = recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);

Nezávislost na platformě

Aspose.OCR pro .NET může fungovat na jakékoli platformě , která podporuje .NET, .NET Core nebo .NET Framework – ať už na místním počítači, na webovém serveru nebo v cloudu.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Podporované formáty souborů

Aspose.OCR for .NET může pracovat prakticky s jakýmkoli souborem můžete získat ze skeneru nebo fotoaparátu. Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu souborů a dat, které lze uložit, importovat do databáze nebo analyzovat v reálném čase.

snímky

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Dávkové OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Výsledky rozpoznávání

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Vhodné pro jakýkoli obsah

Přesnost a spolehlivost rozpoznávání textu velmi závisí na kvalitě původního obrázku. Aspose.OCR for .NET poskytuje širokou škálu plně automatizovaných i manuálních filtrů pro zpracování obrazu, které vylepšují obraz před jeho odesláním do OCR enginu.

Výkonné zpracování obrazu a přizpůsobitelné algoritmy detekce struktury obsahu umožňují extrakci textu z prakticky libovolného obrazu, od vysoce kvalitních skenů po pouliční fotografie. Pro dosažení nejlepší kvality rozpoznávání lze na stejný obrázek použít více filtrů zpracování.

Optimalizace zdrojů

Aspose.OCR for .NET umožňuje vysoce flexibilní vyvážení rychlosti rozpoznávání, kvality a využití zdrojů pro každý konkrétní případ použití:

  • Vyberte si mezi důkladným rozpoznáním a rychlým rozpoznáním.
  • Zadejte počet vláken přidělených pro rozpoznávání nebo povolte knihovně automaticky se škálovat podle počtu jader procesoru.
  • Uvolněte CPU přenesením výpočtů na GPU.

28 rozpoznávacích jazyků

Aspose.OCR for .NET je univerzální řešení pro zpracování dokumentů, extrakci dat a digitalizaci obsahu v celosvětovém měřítku. Díky podpoře široké škály evropských a asijských psacích skriptů je dobře přizpůsobený pro jakékoli měřítko a vyhovuje malým a středním podnikům i nadnárodním korporacím.

Detekci jazyka můžete delegovat na knihovnu nebo ručně určit jazyk, čímž se zvýší výkon a spolehlivost rozpoznávání. Podporovány jsou následující jazyky:

  • Rozšířená latinská abeceda: chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština;
  • Azbuka: běloruská, bulharská, kazašská, ruská, srbská, ukrajinská;
  • Více než 6 000 čínských znaků;
  • Hindština.

Vlastnosti a možnosti

Aspose.OCR for .NET automaticky extrahuje text z fotografií nebo naskenovaných obrázků, čímž eliminuje potřebu ručního přepisování dokumentů.

Feature icon

Foto OCR

Extrahujte text z fotografií smartphonu s přesností na úrovni skenování.

Feature icon

PDF s možností vyhledávání

Převeďte jakýkoli sken na plně prohledávatelný a indexovatelný dokument.

Feature icon

Rozpoznávání URL

Rozpoznejte obrázek z adresy URL, aniž byste jej museli lokálně stahovat.

Feature icon

Hromadné rozpoznání

Přečtěte si všechny obrázky z vícestránkových dokumentů, složek a archivů.

Feature icon

Libovolné písmo a styl

Identifikujte a rozpoznávejte text ve všech oblíbených typech písma a stylech.

Feature icon

Dolaďte rozpoznávání

Upravte každý parametr OCR pro nejlepší výsledky rozpoznávání.

Feature icon

Kontrola pravopisu

Zlepšete výsledky automatickým opravováním chybně napsaných slov.

Feature icon

Najděte text v obrázcích

Hledejte text nebo regulární výraz v sadě obrázků.

Feature icon

Porovnejte texty obrázků

Porovnejte texty na dvou obrázcích bez ohledu na velikost písmen a rozvržení.

Snadné použití

K převodu obrázku na text, vytvoření prohledávatelného PDF, uložení výsledků rozpoznávání do dokumentu a mnoha dalším potřebujete pouze několik řádků kódu. Prozkoumejte ukázky kódu, abyste pochopili, jak integrovat Aspose.OCR for .NET do vašich řešení.

Instalace

Aspose.OCR pro .NET je distribuován jako balíček NuGet nebo jako [soubor ke stažení]( https://releases.aspose.com/ ocr/net/) s minimálními závislostmi. Balíček lze přidat do vašeho projektu přímo z Microsoft Visual Studio. Jednoduše jej nainstalujte do svého projektu a jste připraveni extrahovat text z obrázků a uložit výsledky rozpoznávání v jakémkoli z podporovaných formátů. Pokud má váš systém GPU s podporou CUDA, můžete použít GPU-accelerated OCR engine k výraznému zvýšení výkonu rozpoznávání.

Aspose.OCR pro .NET můžete začít používat hned po instalaci s určitými omezeními . Dočasná licence odstraňuje všechna omezení zkušební verze po dobu 30 dnů. Použijte jej k zahájení budování plně funkční OCR aplikace a ke konečnému rozhodnutí o nákupu Aspose.OCR pro .NET později.

Extrahujte text z fotografie

Když lidé obvykle myslí na OCR (optické rozpoznávání znaků), první spojení je často se skenerem jako primárním snímacím zařízením. Toto spojení má historické důvody a je stále převládající v mnoha kontextech a poskytuje konzistentní a kontrolované prostředí pro zachycení tištěného textu z fyzických dokumentů s bezkonkurenční kvalitou. Skener je však specializované zařízení, které není vždy po ruce a ke svému provozu vyžaduje stacionární pracovní stanici. Naštěstí moderní svět poskytuje pohodlnou alternativu k tradičním skenerům – fotoaparát chytrého telefonu. Pokroky v technologii fotoaparátů smartphonů zajišťují, že i smartphone základní úrovně poskytuje dostatečnou kvalitu pro zachycení dokumentů připravených pro OCR. A vestavěná paměť usnadňuje digitalizaci velkého množství dokumentů, novin, knih, značek ulic a dalšího textu na cestách snadněji než kdy dříve. Vše, co potřebujete, je správná technologie pro převod těchto fotografií na strojově čitelný text.

Aspose.OCR for .NET je speciálně navržen tak, aby rozpoznával všechny typy obrázků ihned po vybalení a lze jej dále doladit, aby zvládl i fotografie nízké kvality. V kombinaci s moderním chytrým telefonem vám umožňuje vytvářet výkonné aplikace OCR pro většinu každodenních úloh skenování a rozpoznávání textu. Nejpokročilejší zpracování obrazu a analýza struktury dokumentu se provádějí v několika řádcích kódu, což vám umožní soustředit se spíše na podnikání než na složité matematické algoritmy, neuronové sítě a další technické složitosti.

Foto OCR - C#

// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
  PreprocessingFilter.ContrastCorrectionFilter(),
  PreprocessingFilter.AutoDewarping()
};

// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");

// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;

// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);

// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);

Vytvořte z naskenovaného souboru PDF s možností vyhledávání

PDF je jedním z nejoblíbenějších formátů pro skenování papírových dokumentů, zejména díky své schopnosti spojit více stránek do jednoho souboru. Tento formát je široce používán pro výměnu smluv, faktur, právních dokumentů, pasů a občanských průkazů a mnoha dalších dokumentů mezi jednotlivci, podniky, bankami a vládními úřady. Jakékoli naskenované PDF je však v podstatě sbírka obrázků. Neobsahuje strojově čitelný text, takže uživatelé nemohou obsah dokumentu vyhledávat, kopírovat ani jinak manipulovat.

Aspose.OCR for .NET vám nabízí rychlý, snadný a vysoce spolehlivý způsob, jak převést jakýkoli naskenovaný soubor PDF na dokument s možností plného vyhledávání a indexování. Přesně rozpoznává obsah stránky a převádí jej na strojově čitelnou textovou vrstvu přes původní obrázek, kterou lze vybírat, kopírovat, číst pomocí softwaru pro převod textu na řeč a dokonce automaticky zpracovávat překladatele, sumarizátory a další analytické nástroje využívající umělou inteligenci. nástroje.

Přidat překryvný text do PDF - C#

// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");

// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);

// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");

Hledejte text v obrázcích

Digitální archivy, zejména ve velkých organizacích, se často skládají z rozsáhlé sbírky skenů a fotografií, z nichž mnohé mohou obsahovat vícestránkové dokumenty. Efektivní správa a efektivní organizace takových archivů je nezbytná pro snadné vyhledávání informací a navigaci. Obrázky však neobsahují strojově čitelný text, což znemožňuje vyhledávání a analýzu obsahu dokumentu.

Aspose.OCR for .NET vám umožňuje snadno vyhledávat text v obrázcích bez ohledu na font, velikost textu, styl a další parametry. Knihovna také podporuje vyhledávání bez rozlišení velkých a malých písmen a regulární výrazy, které jsou mimořádně užitečné v různých aplikacích a odvětvích. Tuto funkci lze použít pro kategorizaci dokumentů na základě obsahu, klíčových slov nebo vzorů nalezených v textu; vyhledávání konkrétních podmínek nebo ustanovení v dohodách a smlouvách; reorganizace souborů na základě klíčových slov nebo obsahu v nich nalezeného; lokalizovat a identifikovat osobní údaje v dokumentech, což usnadňuje zajištění souladu s GDPR a efektivnější správu citlivých informací. Vyhledávání v rámci obrázků také umožňuje vytvářet automatizované pracovní postupy a zefektivnit různé obchodní procesy po obdržení podepsaných smluv a faktur.

Hledání textu v obrázcích - C#

string sourceFolder = "images";
string searchFor = "OCR";

// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
  bool found = api.ImageHasText(image, searchFor);
  if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}