HTML JPG OCR XML BMP
Aspose.OCR  dla C++
TXT

Aspose.Imaging dla Javy

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie JP2 i tworzy dokumenty JP2 zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR

Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Dzięki C++ OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz JP2 na dokument TXT:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.asposeocr_page()
  • Przekaż ścieżkę pliku JP2 jako parametr
  • AsposeOCR.asposeocr_page zwraca ciąg lub plik typu TXT

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że do projektu dodano Microsoft.ML.OnnxRuntime 1.7.0 lub nowszy. Powinien zostać zainstalowany automatycznie, jeśli zainstalujesz Aspose.OCR za pomocą Menedżera pakietów NuGet.

  • Rozwiązanie kompatybilne z NET Standard 2.0+
  • Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • JP2 Co jest JP2 Format pliku

    JPEG 2000 (JP2) to system kodowania obrazu i najnowocześniejszy standard kompresji obrazu. Zaprojektowany przy użyciu technologii wavelet JPEG 2000 może kodować bezstratne treści w dowolnej jakości na raz. Co więcej, bez znaczącej utraty wydajności kodowania, JPEG 2000 ma możliwość skutecznego dostępu i dekodowania tej samej treści w różnych innych rozdzielczościach i jakościach. Strumienie kodu w JPEG 2000 są znacznie skalowalne, posiadając obszary zainteresowania, które zapewniają możliwość przestrzennego dostępu losowego. Posiada do 16384 różnych komponentów o wymiarach w terapikselach i precyzji, która może sięgać nawet 38 bitów na próbkę.

    Czytaj więcej

    TXT Co jest TXT Format pliku

    Plik z rozszerzeniem .TXT reprezentuje dokument tekstowy, który zawiera zwykły tekst w postaci linii. Akapity w dokumencie tekstowym są rozpoznawane przez znaki powrotu karetki i służą do lepszego rozmieszczenia zawartości pliku. Standardowy dokument tekstowy można otworzyć w dowolnym edytorze tekstu lub aplikacji do przetwarzania tekstu w różnych systemach operacyjnych. Cały tekst zawarty w takim pliku jest w formacie czytelnym dla człowieka i reprezentowany przez ciąg znaków.

    Czytaj więcej

    TXT (Plik dokumentu tekstowego)
    Text (Plik dokumentu tekstowego)
    DOC (Dokumenty generowane przez Microsoft Word)
    DOCX (Dokumenty Microsoft Word)
    XLS (Format pliku binarnego Microsoft Excel)
    XLSX (Dokumenty Microsoft Excel)
    PDF (Przenośny format dokumentu (PDF))
    Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)