Převeďte obrázky a PDF na text v C++
Přidejte do svých aplikací C++ pomocí několika řádků kódu optické rozpoznávání znaků (OCR).
Download Free TrialAspose.OCR for C++ rozšiřuje vaše aplikace o možnosti optického rozpoznávání znaků v 5 řádcích kódu. Naše zkušenosti s neuronovými sítěmi a strojovým učením byly převedeny do knihovny OCR s vynikajícím výkonem a přesností, která podporuje 26 jazyků založených na latince a cyrilici a také čínštinu . OCR API dokáže rozpoznat naskenované obrázky, fotografie smartphonu, snímky obrazovky, oblasti obrázků a naskenované soubory PDF a vrátit výsledky v nejoblíbenějších formátech pro výměnu dokumentů a dat. Je zcela offline a ke své práci nevyžaduje připojení k internetu. Rozhraní API vyžaduje minimální úsilí, abyste mohli začít, a mělkou křivku učení. Veškeré předběžné zpracování, korekce zešikmení, odstranění šumu, detekce jazyka, vícevláknové zpracování a další složité úkoly se provádějí automaticky, ale lze je vyladit tak, aby se vypořádaly s těžkými případy.
Pokročilé funkce C++ OCR API
Extrahuje text z obrázků a vytváří prohledávatelné soubory PDF
Podporuje jakýkoli obrázek, který můžete získat ze skeneru nebo fotoaparátu
Čte rozšířenou latinku a cyrilici
Rozpozná přes 6000 čínských znaků
Detekuje a rozpoznává všechny oblíbené druhy písma a formátování
Předběžně zpracovává obrázky před rozpoznáním
Zpracuje celý snímek nebo pouze vybrané oblasti
Podporuje otočené, zkosené a zašuměné obrázky
Dávkové rozpoznání všech obrázků ve složce nebo archivu
Rozpozná obrázky poskytnuté jako webové odkazy
Vyhledá a automaticky opraví chybně napsaná slova
Získejte výsledek rozpoznávání jako JSON
Snadné použití
Stále si myslíte, že C++ OCR je těžké? S naší knihovnou potřebujete pouze 5 řádků kódu k rozpoznání obrázku a zobrazení výsledku. Vyzkoušejte tento kód a přesvědčte se sami:
Obrázek na text v 5 řádcích - C++
// Zadejte cestu k obrázku
std::string image_path = "../Data/Source/sample.png";
// Připravte pufr pro výsledek
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Udělejte kouzlo
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);
// Zobrazit výsledek rozpoznání
std::wcout << buffer << L"\n";
26 Rozpoznávací jazyky
OCR API dokáže rozpoznat velké množství jazyků a všechny populární psací skripty, včetně textů se smíšenými jazyky.
- Rozšířená latinská abeceda : chorvatština, čeština, dánština, holandština, angličtina, estonština, finština, francouzština, němčina, italština, lotyština, litevština, norština, polština, portugalština, rumunština, slovenština, slovinština, španělština, švédština.
- Azbuka : běloruská, bulharská, kazašská, ruská, srbská, ukrajinská.
- Čínština : více než 6 000 znaků.
Detekci jazyka můžete nechat na knihovně nebo si jazyk definovat sami, abyste zvýšili výkon a spolehlivost rozpoznávání.
Dávkové zpracování
OCR API vás osvobodí od rozpoznávání každého obrázku jeden po druhém tím, že nabízí různé metody dávkového zpracování, které vám umožní rozpoznat více obrázků v jednom volání:
- Rozpoznávání vícestránkových souborů PDF a TIFF.
- Rozpoznávání všech souborů ve složce.
- Rozpoznávání všech souborů v archivu.
Rozpoznat ZIP archiv - C++
// Zadejte cestu k archivu
std::string archive_path = "book.zip";
// Připravte pufr pro výsledek
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Inicializujte objekt RecognitionSettings s výchozími hodnotami
RecognitionSettings settings;
// Uznat
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);
Zachovat formátování
Knihovna OCR čte všechny oblíbené druhy písma, jako je Arial, Times New Roman, Courier New, Tahoma, Calibri a další, v běžném, tučném a kurzívě a pečlivě zachovává formátování výsledků OCR. Výsledky rozpoznávání můžete také rozdělit na řádky a detekovat textové oblasti na stránce.
Rozpoznat fotografie
Rozšířené přijetí aplikací OCR je obvykle zastaveno skutečností, že skenery nejsou pro většinu uživatelů samozřejmostí. Naše knihovna OCR má vestavěné výkonné filtry pro předběžné zpracování obrazu, které si poradí s tmavými, otočenými, zkreslenými a zašuměnými obrazy. V kombinaci s podporou všech obrazových formátů umožňuje spolehlivé rozpoznání i fotografií z chytrého telefonu. Většina předzpracování a korekce obrazu probíhá automaticky, takže zasahovat budete muset jen v obtížných případech.
Nastavení vlastního úhlu pro korekci zkosení - C++
// Původní obrázek
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };
// Připravte pufr pro výsledek
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Upravte úhel zkosení
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;
// Rozpoznat obrázek
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
Kontrola pravopisu
Zatímco OCR poskytuje spolehlivé výsledky, prach a vady tisku mohou způsobit nesprávné rozpoznání některých symbolů. OCR API má vestavěnou kontrolu pravopisu, která automaticky nahrazuje chybně napsaná slova a zbavuje vás nutnosti ručně opravovat výsledky rozpoznávání.
Support and Learning Resources
- Výukové zdroje
- Dokumentace
- Zdrojový kód
- Reference API
- Výuková videa
- Podpora produktu
- Bezplatná podpora
- Placená podpora
- Blog
- Poznámky k vydání
- Proč Aspose.OCR pro C++?
- Seznam zákazníků
- Příběhy úspěchu