Aspose.OCR  for C++

Konwertuj obrazy i pliki PDF na tekst w C++

Dodaj optyczne rozpoznawanie znaków (OCR) do aplikacji C++ za pomocą kilku linijek kodu.

  Download Free Trial
  
 

Aspose.OCR dla C++ rozszerza Twoje aplikacje o możliwości optycznego rozpoznawania znaków w 5 wierszach kodu. Nasze doświadczenie w sieciach neuronowych i uczeniu maszynowym zostało przełożone na bibliotekę OCR o doskonałej wydajności i dokładności, która obsługuje 26 języków opartych na skryptach łacińskich i cyrylicy oraz chińskim . OCR API może rozpoznawać zeskanowane obrazy, zdjęcia smartfona, zrzuty ekranu, obszary obrazów i zeskanowane pliki PDF oraz zwracać wyniki w najpopularniejszych formatach wymiany dokumentów i danych. Jest całkowicie offline i nie wymaga połączenia z Internetem. Interfejs API wymaga minimalnego wysiłku, aby rozpocząć i płytkiej krzywej uczenia się do opanowania. Wszystkie wstępne przetwarzanie, korekcja przekrzywienia, usuwanie szumów, wykrywanie języka, wielowątkowość i inne złożone zadania są wykonywane automatycznie, ale można je dostosować do trudnych przypadków.

Zaawansowane funkcje C++ OCR API

Wyodrębnia tekst z obrazów i tworzy przeszukiwalne pliki PDF

Obsługuje dowolny obraz, który można uzyskać ze skanera lub aparatu

Czyta rozszerzone pisma łacińskie i cyrylicę

Rozpoznaje ponad 6000 chińskich znaków

Wykrywa i rozpoznaje wszystkie popularne kroje i formatowanie

Wstępnie przetwarza obrazy przed rozpoznaniem

Przetwarza cały obraz lub tylko wybrane obszary

Obsługuje obrazy obrócone, przekrzywione i zaszumione

Rozpoznawanie wsadowe wszystkich obrazów w folderze lub archiwum

Rozpoznaje obrazy dostarczone jako linki internetowe

Znajduje i automatycznie poprawia błędnie napisane słowa

Uzyskaj wynik rozpoznawania jako JSON

Łatwy w użyciu

Czy nadal uważasz, że C++ OCR jest trudne? Dzięki naszej bibliotece potrzebujesz tylko 5 linii kodu, aby rozpoznać obraz i wyświetlić wynik. Wypróbuj ten kod i przekonaj się sam:

Obraz do tekstu w 5 wierszach - C++

// Podaj ścieżkę obrazu
std::string image_path = "../Data/Source/sample.png";

// Przygotuj bufor na wynik
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Czy magię
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Wyświetl wynik rozpoznawania
std::wcout << buffer << L"\n";

26 języków rozpoznawania

OCR API może rozpoznawać dużą liczbę języków i wszystkie popularne skrypty do pisania, w tym teksty w językach mieszanych.

  • Rozszerzony alfabet łaciński : chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki.
  • Alfabet cyrylicy : białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński.
  • Chiński : ponad 6000 znaków.

Wykrywanie języka można pozostawić bibliotece lub samodzielnie zdefiniować język, aby zwiększyć wydajność i niezawodność rozpoznawania.

Przetwarzanie wsadowe

OCR API uwalnia Cię od rozpoznawania każdego obrazu jeden po drugim, oferując różne metody przetwarzania wsadowego, które pozwalają rozpoznać wiele obrazów w jednym wywołaniu:

  • Rozpoznawanie wielostronicowych plików PDF i TIFF.
  • Rozpoznawanie wszystkich plików w folderze.
  • Rozpoznawanie wszystkich plików w archiwum.

Rozpoznaj archiwum ZIP - C++

// Podaj ścieżkę archiwum
std::string archive_path = "book.zip";

// Przygotuj bufor na wynik
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Zainicjuj obiekt RecognitionSettings z wartościami domyślnymi
RecognitionSettings settings;

// Rozpoznać
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Zachowaj formatowanie

Biblioteka OCR odczytuje wszystkie popularne kroje pisma, takie jak Arial, Times New Roman, Courier New, Tahoma, Calibri i inne, w stylu zwykłym, pogrubionym i kursywą oraz starannie zachowuje formatowanie w wynikach OCR. Możesz także podzielić wyniki rozpoznawania na wiersze i wykryć obszary tekstowe na stronie.

Rozpoznawaj zdjęcia

Powszechne stosowanie aplikacji OCR jest zwykle powstrzymywane przez fakt, że skanery nie są powszechne dla większości użytkowników. Nasza biblioteka OCR ma potężne wbudowane filtry wstępnego przetwarzania obrazu, które mogą obsługiwać ciemne, obrócone, przekrzywione i zaszumione obrazy. W połączeniu z obsługą wszystkich formatów obrazu pozwala na niezawodne rozpoznawanie nawet zdjęć ze smartfona. Większość wstępnego przetwarzania i korekcji obrazu odbywa się automatycznie, więc będziesz musiał interweniować tylko w trudnych przypadkach.

Ustaw niestandardowy kąt do korekcji skosu - C++

// Oryginalny obraz
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Przygotuj bufor na wynik
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Dostosuj kąt pochylenia
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Rozpoznaj obraz
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Sprawdzanie pisowni

Chociaż funkcja OCR zapewnia wiarygodne wyniki, kurz i defekty druku mogą powodować nieprawidłowe rozpoznawanie niektórych symboli. Interfejs API OCR ma wbudowany moduł sprawdzania pisowni, który automatycznie zastępuje błędnie napisane słowa i uwalnia od konieczności ręcznego poprawiania wyników rozpoznawania.

  
  

Aspose oferuje również natywne API OCR dla innych popularnych języków programowania: