przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie JPEG i tworzy dokumenty JPEG zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR
Maven lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
Dzięki C++ OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz JPEG na dokument DOCX:
- Utwórz instancję klasy AsposeOcr
- Wywołaj metodę AsposeOCR.asposeocr_page()
- Przekaż ścieżkę pliku JPEG jako parametr
- AsposeOCR.asposeocr_page zwraca ciąg lub plik typu DOCX
wymagania systemowe
Przed uruchomieniem przykładu upewnij się, że do projektu dodano Microsoft.ML.OnnxRuntime 1.7.0 lub nowszy. Powinien zostać zainstalowany automatycznie, jeśli zainstalujesz Aspose.OCR za pomocą Menedżera pakietów NuGet.
- Rozwiązanie kompatybilne z NET Standard 2.0+
- Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
JPEG Co jest JPEG Format pliku
JPEG to rodzaj formatu obrazu, który jest zapisywany przy użyciu metody kompresji stratnej. Obraz wyjściowy w wyniku kompresji jest kompromisem między rozmiarem pamięci a jakością obrazu. Użytkownicy mogą dostosować poziom kompresji, aby osiągnąć pożądany poziom jakości, jednocześnie zmniejszając rozmiar pamięci. Jakość obrazu ulega nieznacznemu pogorszeniu, jeśli do obrazu zostanie zastosowana kompresja 10:1. Im wyższa wartość kompresji, tym większa degradacja jakości obrazu.
Czytaj więcejDOCX Co jest DOCX Format pliku
DOCX to dobrze znany format dokumentów Microsoft Word. Wprowadzony w 2007 roku wraz z wydaniem pakietu Microsoft Office 2007, struktura tego nowego formatu dokumentu została zmieniona ze zwykłego binarnego na kombinację plików XML i binarnych. Pliki Docx można otwierać w programie Word 2007 i wersjach pobocznych, ale nie we wcześniejszych wersjach programu MS Word, które obsługują rozszerzenia plików DOC.
Czytaj więcej