Aspose.OCR  for C++

Převeďte obrázky a PDF na text v C++

Přidejte do svých aplikací C++ pomocí několika řádků kódu optické rozpoznávání znaků (OCR).

  Download Free Trial
  
 

Aspose.OCR for C++ rozšiřuje vaše aplikace o možnosti optického rozpoznávání znaků v 5 řádcích kódu. Naše zkušenosti s neuronovými sítěmi a strojovým učením byly převedeny do knihovny OCR s vynikajícím výkonem a přesností, která podporuje 26 jazyků založených na latince a cyrilici a také čínštinu . OCR API dokáže rozpoznat naskenované obrázky, fotografie smartphonu, snímky obrazovky, oblasti obrázků a naskenované soubory PDF a vrátit výsledky v nejoblíbenějších formátech pro výměnu dokumentů a dat. Je zcela offline a ke své práci nevyžaduje připojení k internetu. Rozhraní API vyžaduje minimální úsilí, abyste mohli začít, a mělkou křivku učení. Veškeré předběžné zpracování, korekce zešikmení, odstranění šumu, detekce jazyka, vícevláknové zpracování a další složité úkoly se provádějí automaticky, ale lze je vyladit tak, aby se vypořádaly s těžkými případy.

Pokročilé funkce C++ OCR API

Extrahuje text z obrázků a vytváří prohledávatelné soubory PDF

Podporuje jakýkoli obrázek, který můžete získat ze skeneru nebo fotoaparátu

Čte rozšířenou latinku a cyrilici

Rozpozná přes 6000 čínských znaků

Detekuje a rozpoznává všechny oblíbené druhy písma a formátování

Předběžně zpracovává obrázky před rozpoznáním

Zpracuje celý snímek nebo pouze vybrané oblasti

Podporuje otočené, zkosené a zašuměné obrázky

Dávkové rozpoznání všech obrázků ve složce nebo archivu

Rozpozná obrázky poskytnuté jako webové odkazy

Vyhledá a automaticky opraví chybně napsaná slova

Získejte výsledek rozpoznávání jako JSON

Snadné použití

Stále si myslíte, že C++ OCR je těžké? S naší knihovnou potřebujete pouze 5 řádků kódu k rozpoznání obrázku a zobrazení výsledku. Vyzkoušejte tento kód a přesvědčte se sami:

Obrázek na text v 5 řádcích - C++

// Zadejte cestu k obrázku
std::string image_path = "../Data/Source/sample.png";

// Připravte pufr pro výsledek
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Udělejte kouzlo
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Zobrazit výsledek rozpoznání
std::wcout << buffer << L"\n";

26 Rozpoznávací jazyky

OCR API dokáže rozpoznat velké množství jazyků a všechny populární psací skripty, včetně textů se smíšenými jazyky.

  • Rozšířená latinská abeceda : chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština.
  • Azbuka : běloruská, bulharská, kazašská, ruská, srbská, ukrajinská.
  • Čínština : více než 6 000 znaků.

Detekci jazyka můžete nechat na knihovně nebo si jazyk definovat sami, abyste zvýšili výkon a spolehlivost rozpoznávání.

Dávkové zpracování

OCR API vás osvobodí od rozpoznávání každého obrázku jeden po druhém tím, že nabízí různé metody dávkového zpracování, které vám umožní rozpoznat více obrázků v jednom volání:

  • Rozpoznávání vícestránkových souborů PDF a TIFF.
  • Rozpoznávání všech souborů ve složce.
  • Rozpoznávání všech souborů v archivu.

Rozpoznat ZIP archiv - C++

// Zadejte cestu k archivu
std::string archive_path = "book.zip";

// Připravte pufr pro výsledek
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Inicializujte objekt RecognitionSettings s výchozími hodnotami
RecognitionSettings settings;

// Uznat
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Zachovat formátování

Knihovna OCR čte všechny oblíbené druhy písma, jako je Arial, Times New Roman, Courier New, Tahoma, Calibri a další, v běžném, tučném a kurzívě a pečlivě zachovává formátování výsledků OCR. Výsledky rozpoznávání můžete také rozdělit na řádky a detekovat textové oblasti na stránce.

Rozpoznat fotografie

Rozšířené přijetí aplikací OCR je obvykle zastaveno skutečností, že skenery nejsou pro většinu uživatelů samozřejmostí. Naše knihovna OCR má vestavěné výkonné filtry pro předběžné zpracování obrazu, které si poradí s tmavými, otočenými, zkreslenými a zašuměnými obrazy. V kombinaci s podporou všech obrazových formátů umožňuje spolehlivé rozpoznání i fotografií z chytrého telefonu. Většina předzpracování a korekce obrazu probíhá automaticky, takže zasahovat budete muset jen v obtížných případech.

Nastavení vlastního úhlu pro korekci zkosení - C++

// Původní obrázek
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Připravte pufr pro výsledek
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Upravte úhel zkosení
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Rozpoznat obrázek
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Kontrola pravopisu

Zatímco OCR poskytuje spolehlivé výsledky, prach a vady tisku mohou způsobit nesprávné rozpoznání některých symbolů. OCR API má vestavěnou kontrolu pravopisu, která automaticky nahrazuje chybně napsaná slova a zbavuje vás nutnosti ručně opravovat výsledky rozpoznávání.

  
  

Aspose také nabízí nativní rozhraní OCR API pro další oblíbené programovací jazyky: