Konwertuj obrazy i pliki PDF na tekst w C++

Dodaj optyczne rozpoznawanie znaków (OCR) do aplikacji C++ za pomocą kilku linijek kodu.

Aspose.OCR dla C++ rozszerza Twoje aplikacje o możliwości optycznego rozpoznawania znaków w 5 wierszach kodu. Nasze doświadczenie w sieciach neuronowych i uczeniu maszynowym zostało przełożone na bibliotekę OCR o doskonałej wydajności i dokładności, która obsługuje 26 języków opartych na skryptach łacińskich i cyrylicy oraz chińskim . OCR API może rozpoznawać zeskanowane obrazy, zdjęcia smartfona, zrzuty ekranu, obszary obrazów i zeskanowane pliki PDF oraz zwracać wyniki w najpopularniejszych formatach wymiany dokumentów i danych. Jest całkowicie offline i nie wymaga połączenia z Internetem. Interfejs API wymaga minimalnego wysiłku, aby rozpocząć i płytkiej krzywej uczenia się do opanowania. Wszystkie wstępne przetwarzanie, korekcja przekrzywienia, usuwanie szumów, wykrywanie języka, wielowątkowość i inne złożone zadania są wykonywane automatycznie, ale można je dostosować do trudnych przypadków.

W skrócie

Krótkie podsumowanie możliwości optycznego rozpoznawania znaków.

Podstawowe cechy

Wyodrębnij tekst ze zdjęć
Twórz przeszukiwalne pliki PDF
Automatyczne korekty obrazu
Obsługa wielu krojów pisma
Zachowaj formatowanie tekstu
Wykryj fragmenty tekstu
Przetwarzanie wsadowe
Sprawdzanie pisowni

Obsługiwane języki

język angielski
język chiński
język niemiecki
język francuski
język włoski
język hiszpański
Język rosyjski
język czeski
Język polski
Język ukraiński
język duński
język estoński
i 10+ więcej

Aspose.OCR

Niezależność od platformy

Biblioteka OCR w pełni obsługuje aplikacje C++ zarówno dla systemu Windows, jak i Linux.

Windows 64 bit

Linux 64 bit

Aspose.OCR

Obsługiwane formaty plików

Konwertuj dowolny plik uzyskany ze skanera lub aparatu fotograficznego do najpopularniejszych formatów wymiany dokumentów i danych.

Pliki źródłowe

PDF
JPEG
PNG
TIFF
BMP

Wyniki uznania

Przeszukiwalny plik PDF
Microsoft Word
Microsoft Excel
Zwykły tekst
JSON
XML

Aspose.OCR

Zaawansowane funkcje C++ OCR API

Wyodrębnia tekst z obrazów i tworzy przeszukiwalne pliki PDF

Obsługuje dowolny obraz, który można uzyskać ze skanera lub aparatu

Czyta rozszerzone pisma łacińskie i cyrylicę

Rozpoznaje ponad 6000 chińskich znaków

Wykrywa i rozpoznaje wszystkie popularne kroje i formatowanie

Wstępnie przetwarza obrazy przed rozpoznaniem

Przetwarza cały obraz lub tylko wybrane obszary

Obsługuje obrazy obrócone, przekrzywione i zaszumione

Rozpoznawanie wsadowe wszystkich obrazów w folderze lub archiwum

Rozpoznaje obrazy dostarczone jako linki internetowe

Znajduje i automatycznie poprawia błędnie napisane słowa

Uzyskaj wynik rozpoznawania jako JSON

Łatwy w użyciu

Czy nadal uważasz, że C++ OCR jest trudne? Dzięki naszej bibliotece potrzebujesz tylko 5 linii kodu, aby rozpoznać obraz i wyświetlić wynik. Wypróbuj ten kod i przekonaj się sam:

Obraz do tekstu w 5 wierszach - C++

// Podaj ścieżkę obrazu
std::string image_path = "../Data/Source/sample.png";

// Przygotuj bufor na wynik
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Czy magię
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Wyświetl wynik rozpoznawania
std::wcout << buffer << L"\n";

26 języków rozpoznawania

OCR API może rozpoznawać dużą liczbę języków i wszystkie popularne skrypty do pisania, w tym teksty w językach mieszanych.

Rozszerzony alfabet łaciński : chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, niemiecki, włoski, łotewski, litewski, norweski, polski, portugalski, rumuński, słowacki, słoweński, hiszpański, szwedzki.
Alfabet cyrylicy : białoruski, bułgarski, kazachski, rosyjski, serbski, ukraiński.
Chiński : ponad 6000 znaków.

Wykrywanie języka można pozostawić bibliotece lub samodzielnie zdefiniować język, aby zwiększyć wydajność i niezawodność rozpoznawania.

Przetwarzanie wsadowe

OCR API uwalnia Cię od rozpoznawania każdego obrazu jeden po drugim, oferując różne metody przetwarzania wsadowego, które pozwalają rozpoznać wiele obrazów w jednym wywołaniu:

Rozpoznawanie wielostronicowych plików PDF i TIFF.
Rozpoznawanie wszystkich plików w folderze.
Rozpoznawanie wszystkich plików w archiwum.

Rozpoznaj archiwum ZIP - C++

// Podaj ścieżkę archiwum
std::string archive_path = "book.zip";

// Przygotuj bufor na wynik
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Zainicjuj obiekt RecognitionSettings z wartościami domyślnymi
RecognitionSettings settings;

// Rozpoznać
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Zachowaj formatowanie

Biblioteka OCR odczytuje wszystkie popularne kroje pisma, takie jak Arial, Times New Roman, Courier New, Tahoma, Calibri i inne, w stylu zwykłym, pogrubionym i kursywą oraz starannie zachowuje formatowanie w wynikach OCR. Możesz także podzielić wyniki rozpoznawania na wiersze i wykryć obszary tekstowe na stronie.

Rozpoznawaj zdjęcia

Powszechne stosowanie aplikacji OCR jest zwykle powstrzymywane przez fakt, że skanery nie są powszechne dla większości użytkowników. Nasza biblioteka OCR ma potężne wbudowane filtry wstępnego przetwarzania obrazu, które mogą obsługiwać ciemne, obrócone, przekrzywione i zaszumione obrazy. W połączeniu z obsługą wszystkich formatów obrazu pozwala na niezawodne rozpoznawanie nawet zdjęć ze smartfona. Większość wstępnego przetwarzania i korekcji obrazu odbywa się automatycznie, więc będziesz musiał interweniować tylko w trudnych przypadkach.

Ustaw niestandardowy kąt do korekcji skosu - C++

// Oryginalny obraz
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Przygotuj bufor na wynik
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Dostosuj kąt pochylenia
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Rozpoznaj obraz
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Sprawdzanie pisowni

Chociaż funkcja OCR zapewnia wiarygodne wyniki, kurz i defekty druku mogą powodować nieprawidłowe rozpoznawanie niektórych symboli. Interfejs API OCR ma wbudowany moduł sprawdzania pisowni, który automatycznie zastępuje błędnie napisane słowa i uwalnia od konieczności ręcznego poprawiania wyników rozpoznawania.

Support and Learning Resources

Dlaczego Aspose.OCR dla C++?
Lista klientów
Historie sukcesów

Download Free Trial Pricing Information

Aspose oferuje również natywne API OCR dla innych popularnych języków programowania:

Konwertuj obrazy i pliki PDF na tekst w C++

Dodaj optyczne rozpoznawanie znaków (OCR) do aplikacji C++ za pomocą kilku linijek kodu.

Aspose.OCR for C++

Overview

W skrócie

Niezależność od platformy

Obsługiwane formaty plików

Zaawansowane funkcje C++ OCR API

Łatwy w użyciu

Obraz do tekstu w 5 wierszach - C++

26 języków rozpoznawania

Przetwarzanie wsadowe

Rozpoznaj archiwum ZIP - C++

Zachowaj formatowanie

Rozpoznawaj zdjęcia

Ustaw niestandardowy kąt do korekcji skosu - C++

Sprawdzanie pisowni

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forJava