HTML JPG OCR XML BMP

Searchable PDF

przetwarza zeskanowane obrazy, a nawet zdjęcia ze smartfona w formacie JPG i tworzy dokumenty JPG zawierające rozpoznany tekst. Aby dodać go do swojego projektu, wystarczy pobrać Aspose.OCR

Aspose Maven Repository lub określ konfigurację repozytorium Aspose Maven i zainstaluj go w swoim projekcie opartym na Maven, dodając następujące konfiguracje do pliku pom.xml. Przykłady Graddle, Ivy, Sbt znajdziesz w naszym repozytorium .

Package Manager Console Command
  PM> Install-Package Aspose.OCR.Cpp

Dzięki C++ OCR i zaledwie kilku linijkom kodu możesz stworzyć w pełni funkcjonalną aplikację, która konwertuje obraz JPG na dokument Searchable PDF:

Utwórz instancję klasy AsposeOcr
Wywołaj metodę AsposeOCR.asposeocr_page()
Przekaż ścieżkę pliku JPG jako parametr
AsposeOCR.asposeocr_page zwraca ciąg lub plik typu Searchable PDF

wymagania systemowe

Przed uruchomieniem przykładu upewnij się, że do projektu dodano Microsoft.ML.OnnxRuntime 1.7.0 lub nowszy. Powinien zostać zainstalowany automatycznie, jeśli zainstalujesz Aspose.OCR za pomocą Menedżera pakietów NuGet.

Rozwiązanie kompatybilne z NET Standard 2.0+
Aspose.OCR dla platformy .NET, do której odwołuje się Twój projekt.

std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";

JPG Co jest JPG Format pliku

JPEG to rodzaj formatu obrazu, który jest zapisywany przy użyciu metody kompresji stratnej. Obraz wyjściowy w wyniku kompresji jest kompromisem między rozmiarem pamięci a jakością obrazu. Użytkownicy mogą dostosować poziom kompresji, aby osiągnąć pożądany poziom jakości, jednocześnie zmniejszając rozmiar pamięci. Jakość obrazu ulega nieznacznemu pogorszeniu, jeśli do obrazu zostanie zastosowana kompresja 10:1. Im wyższa wartość kompresji, tym większa degradacja jakości obrazu.

Czytaj więcej

Searchable PDF Co jest Searchable PDF Format pliku

Przeszukiwalne pliki PDF zachowują oryginalny zeskanowany obraz do przeglądania, a także tekst OCR w ukrytej warstwie, która może być używana do wyszukiwania pełnotekstowego w dokumencie lub podświetlania tekstu do operacji kopiowania i wklejania. Pełna konwersja OCR do formatu PDF, bez oryginalnego obrazu, nigdy nie zachowa 100% oryginalnego formatowania, zwłaszcza jeśli dokument zawiera wiele obrazów lub złożony układ.

Czytaj więcej

TXT (Plik dokumentu tekstowego)

Text (Plik dokumentu tekstowego)

DOC (Dokumenty generowane przez Microsoft Word)

DOCX (Dokumenty Microsoft Word)

XLS (Format pliku binarnego Microsoft Excel)

XLSX (Dokumenty Microsoft Excel)

PDF (Przenośny format dokumentu (PDF))

Searchable PDF (Przeszukiwalna przenośna grafika sieciowa)

Aspose.OCR dla C++

Overview

Package Manager Console Command

wymagania systemowe

JPG Co jest JPG Format pliku

Searchable PDF Co jest Searchable PDF Format pliku