Nativní OCR API pro aplikace .NET
Převést obrázek na text v C#
Více vitrín >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source
= new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("image-with-text.png");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
> dotnet add package Aspose.OCR
Proč Aspose.OCR pro .NET?
Aspose.OCR for .NET je robustní, pro vývojáře přívětivé a cenově výhodné API pro optické rozpoznávání znaků. V méně než 10 řádcích nativního kódu C# můžete zabudovat možnosti OCR do svých desktopových řešení .NET, webových aplikací založených na MVC, cloudových služeb a funkcí Azure bez serveru. Extrahujte strojově čitelný text ze skenů, fotografií a snímků obrazovky, převádějte naskenované stránky do prohledávatelných a indexovatelných PDF, najděte a porovnejte text na obrázcích se zaměřením na obchodní úkol spíše než na složitou matematiku, neuronové sítě a další technické složitosti. Kliknutím na položky níže se dozvíte více o našich funkcích a výhodách.
Globální aplikace
Rozpozná texty v latince, azbuce a asijských písmech, včetně více než 6 000 čínských znaků a hindštiny.
Přečtěte si vše
Získejte text z libovolného souboru získaného pomocí skeneru nebo fotoaparátu a zpracujte obrázky přímo z webových odkazů.
Spolehlivé výsledky
Dosáhněte vysoké přesnosti rozpoznávání všech obrázků, včetně těch, které jsou neostré, otočené, zkreslené a zašuměné.
Rozpoznávání dávky
Hromadně rozpoznat všechny obrázky ze složek a archivů; číst vícestránkové dokumenty PDF a obrázky TIFF.
Detekce rozložení
Identifikujte a kategorizujte bloky obsahu v obrázcích, abyste zajistili správné pořadí extrahovaného textu bez ohledu na rozvržení.
Ukázka živého kódu
Optické rozpoznávání znaků se s Aspose.OCR stává triviálním a přímočarým úkolem, a to i pro vývojáře, kteří s touto technologií začínají. K extrahování textu z obrázku a jeho zobrazení na obrazovce stačí jen pár řádků kódu. Je to opravdu tak jednoduché - zkuste to.
* Nahráním souborů nebo používáním služby souhlasíte s našimi Podmínky použití a Zásady ochrany osobních údajů.
Převést obrázek na text
Další příklady >// Initialize OCR engine
var recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add image to the recognition batch
var source = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
source.Add("<file name>");
// Perform OCR
List<Aspose.OCR.RecognitionResult> results
= recognitionEngine.Recognize(source);
// Output recognized text
Console.WriteLine(results[0].RecognitionText);
Nezávislost na platformě
Aspose.OCR pro .NET může fungovat na jakékoli platformě , která podporuje .NET, .NET Core nebo .NET Framework – ať už na místním počítači, na webovém serveru nebo v cloudu.
Podporované formáty souborů
Aspose.OCR for .NET může pracovat prakticky s jakýmkoli souborem můžete získat ze skeneru nebo fotoaparátu. Výsledky rozpoznávání jsou vráceny v nejoblíbenějších formátech pro výměnu souborů a dat, které lze uložit, importovat do databáze nebo analyzovat v reálném čase.
snímky
- JPEG
- PNG
- TIFF
- BMP
- GIF
Dávkové OCR
- Multi-page PDF
- DjVu
- ZIP
- Folder
Výsledky rozpoznávání
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Vhodné pro jakýkoli obsah
Přesnost a spolehlivost rozpoznávání textu velmi závisí na kvalitě původního obrázku. Aspose.OCR for .NET poskytuje širokou škálu plně automatizovaných i manuálních filtrů pro zpracování obrazu, které vylepšují obraz před jeho odesláním do OCR enginu.
Výkonné zpracování obrazu a přizpůsobitelné algoritmy detekce struktury obsahu umožňují extrakci textu z prakticky libovolného obrazu, od vysoce kvalitních skenů po pouliční fotografie. Pro dosažení nejlepší kvality rozpoznávání lze na stejný obrázek použít více filtrů zpracování.
Optimalizace zdrojů
Aspose.OCR for .NET umožňuje vysoce flexibilní vyvážení rychlosti rozpoznávání, kvality a využití zdrojů pro každý konkrétní případ použití:
- Vyberte si mezi důkladným rozpoznáním a rychlým rozpoznáním.
- Zadejte počet vláken přidělených pro rozpoznávání nebo povolte knihovně automaticky se škálovat podle počtu jader procesoru.
- Uvolněte CPU přenesením výpočtů na GPU.
28 rozpoznávacích jazyků
Aspose.OCR for .NET je univerzální řešení pro zpracování dokumentů, extrakci dat a digitalizaci obsahu v celosvětovém měřítku. Díky podpoře široké škály evropských a asijských psacích skriptů je dobře přizpůsobený pro jakékoli měřítko a vyhovuje malým a středním podnikům i nadnárodním korporacím.
Detekci jazyka můžete delegovat na knihovnu nebo ručně určit jazyk, čímž se zvýší výkon a spolehlivost rozpoznávání. Podporovány jsou následující jazyky:
- Rozšířená latinská abeceda: chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština;
- Azbuka: běloruská, bulharská, kazašská, ruská, srbská, ukrajinská;
- Více než 6 000 čínských znaků;
- Hindština.
Vlastnosti a možnosti
Aspose.OCR for .NET automaticky extrahuje text z fotografií nebo naskenovaných obrázků, čímž eliminuje potřebu ručního přepisování dokumentů.
Foto OCR
Extrahujte text z fotografií smartphonu s přesností na úrovni skenování.
PDF s možností vyhledávání
Převeďte jakýkoli sken na plně prohledávatelný a indexovatelný dokument.
Rozpoznávání URL
Rozpoznejte obrázek z adresy URL, aniž byste jej museli lokálně stahovat.
Hromadné rozpoznání
Přečtěte si všechny obrázky z vícestránkových dokumentů, složek a archivů.
Libovolné písmo a styl
Identifikujte a rozpoznávejte text ve všech oblíbených typech písma a stylech.
Dolaďte rozpoznávání
Upravte každý parametr OCR pro nejlepší výsledky rozpoznávání.
Kontrola pravopisu
Zlepšete výsledky automatickým opravováním chybně napsaných slov.
Najděte text v obrázcích
Hledejte text nebo regulární výraz v sadě obrázků.
Porovnejte texty obrázků
Porovnejte texty na dvou obrázcích bez ohledu na velikost písmen a rozvržení.
Snadné použití
K převodu obrázku na text, vytvoření prohledávatelného PDF, uložení výsledků rozpoznávání do dokumentu a mnoha dalším potřebujete pouze několik řádků kódu. Prozkoumejte ukázky kódu, abyste pochopili, jak integrovat Aspose.OCR for .NET do vašich řešení.
Instalace
Aspose.OCR pro .NET můžete začít používat hned po instalaci s určitými omezeními . Dočasná licence odstraňuje všechna omezení zkušební verze po dobu 30 dnů. Použijte jej k zahájení budování plně funkční OCR aplikace a ke konečnému rozhodnutí o nákupu Aspose.OCR pro .NET později.
Extrahujte text z fotografie
Když lidé obvykle myslí na OCR (optické rozpoznávání znaků), první spojení je často se skenerem jako primárním snímacím zařízením. Toto spojení má historické důvody a je stále převládající v mnoha kontextech a poskytuje konzistentní a kontrolované prostředí pro zachycení tištěného textu z fyzických dokumentů s bezkonkurenční kvalitou. Skener je však specializované zařízení, které není vždy po ruce a ke svému provozu vyžaduje stacionární pracovní stanici. Naštěstí moderní svět poskytuje pohodlnou alternativu k tradičním skenerům – fotoaparát chytrého telefonu. Pokroky v technologii fotoaparátů smartphonů zajišťují, že i smartphone základní úrovně poskytuje dostatečnou kvalitu pro zachycení dokumentů připravených pro OCR. A vestavěná paměť usnadňuje digitalizaci velkého množství dokumentů, novin, knih, značek ulic a dalšího textu na cestách snadněji než kdy dříve. Vše, co potřebujete, je správná technologie pro převod těchto fotografií na strojově čitelný text.
Aspose.OCR for .NET je speciálně navržen tak, aby rozpoznával všechny typy obrázků ihned po vybalení a lze jej dále doladit, aby zvládl i fotografie nízké kvality. V kombinaci s moderním chytrým telefonem vám umožňuje vytvářet výkonné aplikace OCR pro většinu každodenních úloh skenování a rozpoznávání textu. Nejpokročilejší zpracování obrazu a analýza struktury dokumentu se provádějí v několika řádcích kódu, což vám umožní soustředit se spíše na podnikání než na složité matematické algoritmy, neuronové sítě a další technické složitosti.
Foto OCR - C#
// Configure preprocessing filters
PreprocessingFilter filters = new PreprocessingFilter {
PreprocessingFilter.ContrastCorrectionFilter(),
PreprocessingFilter.AutoDewarping()
};
// Add a photo for recognition
OcrInput photos = new OcrInput(InputType.SingleImage, filters);
photos.Add("photo.png");
// Fine-tune recognition setings
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.Eng;
settings.DetectAreasMode = DetectAreasMode.CURVED_TEXT;
// Extract text from a page
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> results = api.Recognize(photos, settings);
// Automatically correct spelling (English)
string text = results[0].GetSpellCheckCorrectedText(SpellCheckLanguage.Eng);
// Display recognized text
Console.WriteLine(text);
Vytvořte z naskenovaného souboru PDF s možností vyhledávání
PDF je jedním z nejoblíbenějších formátů pro skenování papírových dokumentů, zejména díky své schopnosti spojit více stránek do jednoho souboru. Tento formát je široce používán pro výměnu smluv, faktur, právních dokumentů, pasů a občanských průkazů a mnoha dalších dokumentů mezi jednotlivci, podniky, bankami a vládními úřady. Jakékoli naskenované PDF je však v podstatě sbírka obrázků. Neobsahuje strojově čitelný text, takže uživatelé nemohou obsah dokumentu vyhledávat, kopírovat ani jinak manipulovat.
Aspose.OCR for .NET vám nabízí rychlý, snadný a vysoce spolehlivý způsob, jak převést jakýkoli naskenovaný soubor PDF na dokument s možností plného vyhledávání a indexování. Přesně rozpoznává obsah stránky a převádí jej na strojově čitelnou textovou vrstvu přes původní obrázek, kterou lze vybírat, kopírovat, číst pomocí softwaru pro převod textu na řeč a dokonce automaticky zpracovávat překladatele, sumarizátory a další analytické nástroje využívající umělou inteligenci. nástroje.
Přidat překryvný text do PDF - C#
// Load the scanned PDF
OcrInput pdf = new OcrInput(InputType.PDF);
pdf.Add("Delivery-Agreement.pdf");
// Recognize the text from document
AsposeOcr api = new AsposeOcr();
List<RecognitionResult> result = api.Recognize(pdf);
// Save searchable PDF
AsposeOcr.SaveMultipageDocument("Readable-Contract.pdf", SaveFormat.Pdf, result);
// Report progress
Console.WriteLine($@"Recognition finished. See '{Directory.GetCurrentDirectory()}\Readable-Contract.pdf'.");
Hledejte text v obrázcích
Digitální archivy, zejména ve velkých organizacích, se často skládají z rozsáhlé sbírky skenů a fotografií, z nichž mnohé mohou obsahovat vícestránkové dokumenty. Efektivní správa a efektivní organizace takových archivů je nezbytná pro snadné vyhledávání informací a navigaci. Obrázky však neobsahují strojově čitelný text, což znemožňuje vyhledávání a analýzu obsahu dokumentu.
Aspose.OCR for .NET vám umožňuje snadno vyhledávat text v obrázcích bez ohledu na font, velikost textu, styl a další parametry. Knihovna také podporuje vyhledávání bez rozlišení velkých a malých písmen a regulární výrazy, které jsou mimořádně užitečné v různých aplikacích a odvětvích. Tuto funkci lze použít pro kategorizaci dokumentů na základě obsahu, klíčových slov nebo vzorů nalezených v textu; vyhledávání konkrétních podmínek nebo ustanovení v dohodách a smlouvách; reorganizace souborů na základě klíčových slov nebo obsahu v nich nalezeného; lokalizovat a identifikovat osobní údaje v dokumentech, což usnadňuje zajištění souladu s GDPR a efektivnější správu citlivých informací. Vyhledávání v rámci obrázků také umožňuje vytvářet automatizované pracovní postupy a zefektivnit různé obchodní procesy po obdržení podepsaných smluv a faktur.
Hledání textu v obrázcích - C#
string sourceFolder = "images";
string searchFor = "OCR";
// Search for text in images
AsposeOcr api = new AsposeOcr();
foreach(var image in Directory.GetFiles(sourceFolder,"*.png"))
{
bool found = api.ImageHasText(image, searchFor);
if(found) Console.WriteLine($@"Found ""{searchFor}"" in image ""{image}""");
}