HTML JPG OCR XML BMP
Aspose.OCR  dla C++
Searchable PDF

Aspose.Imaging dla Javy

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie DJVU i tworzy dokumenty DJVU zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR

Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

Dzięki C++ OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz DJVU na dokument Searchable PDF:

  • Utwórz instancję klasy AsposeOcr
  • Wywołaj metodę AsposeOCR.asposeocr_page()
  • Przekaż ścieżkę pliku DJVU jako parametr
  • AsposeOCR.asposeocr_page zwraca ciąg lub plik typu Searchable PDF

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że do projektu dodano Microsoft.ML.OnnxRuntime 1.7.0 lub nowszy. Powinien zostać zainstalowany automatycznie, jeśli zainstalujesz Aspose.OCR za pomocą Menedżera pakietów NuGet.

  • Rozwiązanie kompatybilne z NET Standard 2.0+
  • Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • DJVU Co jest DJVU Format pliku

    DjVu, wymawiane jako „déjà vu”, to format plików graficznych przeznaczony dla zeskanowanych dokumentów i książek, zwłaszcza zawierających kombinację tekstu, rysunków, obrazów i fotografii. Został opracowany przez AT&T Labs. Wykorzystuje wiele technik, takich jak separacja warstw obrazu tekstu i obrazów tła, ładowanie progresywne, kodowanie arytmetyczne i kompresja stratna dla obrazów dwukolorowych. Ponieważ plik DJVU może zawierać skompresowane, ale wysokiej jakości kolorowe obrazy, zdjęcia, tekst i rysunki, i może być zapisany na mniejszej przestrzeni, dlatego jest używany w Internecie jako e-booki, podręczniki, gazety, starożytne dokumenty itp.

    Czytaj więcej

    Searchable PDF Co jest Searchable PDF Format pliku

    Przeszukiwalne pliki PDF zachowują oryginalny zeskanowany obraz do przeglądania, a także tekst OCR w ukrytej warstwie, która może być używana do wyszukiwania pełnotekstowego w dokumencie lub podświetlania tekstu do operacji kopiowania i wklejania. Pełna konwersja OCR do formatu PDF, bez oryginalnego obrazu, nigdy nie zachowa 100% oryginalnego formatowania, zwłaszcza jeśli dokument zawiera wiele obrazów lub złożony układ.

    Czytaj więcej