обрабатывает отсканированные изображения или даже фотографии со смартфона в формате JPEG и создает документы JPEG, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно получить Aspose.OCR
Maven или укажите конфигурацию репозитория Aspose Maven. и установите его в своем проекте на основе Maven, добавив следующие конфигурации в файл pom.xml. Примеры Gradle, Ivy, Sbt можно найти в нашем [репозитории] ( https://repository.aspose.com/ocr/ ) .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
С помощью C++ OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение JPEG в документ TXT:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.asposeocr_page()
- Передайте путь к файлу JPEG в качестве параметра
- AsposeOCR.asposeocr_page возвращает строку или файл типа TXT
Системные Требования
Перед запуском примера убедитесь, что в проект добавлен Microsoft.ML.OnnxRuntime 1.7.0 или более поздней версии. Он должен быть установлен автоматически, если вы устанавливаете Aspose.OCR через диспетчер пакетов NuGet.
- Решение, совместимое с NET Standard 2.0+
- Aspose.OCR для .NET, указанный в вашем проекте.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
JPEG Что такое JPEG Формат файла
JPEG — это тип формата изображения, который сохраняется с использованием метода сжатия с потерями. Выходное изображение в результате сжатия представляет собой компромисс между размером хранилища и качеством изображения. Пользователи могут настроить уровень сжатия для достижения желаемого уровня качества и в то же время уменьшить размер хранилища. Качество изображения незначительно ухудшается, если к изображению применяется сжатие 10:1. Чем выше значение сжатия, тем выше ухудшение качества изображения.
Читать далееTXT Что такое TXT Формат файла
Файл с расширением .TXT представляет собой текстовый документ, содержащий обычный текст в виде строк. Абзацы в текстовом документе распознаются возвратом каретки и используются для лучшего расположения содержимого файла. Стандартный текстовый документ можно открыть в любом текстовом редакторе или текстовом редакторе в разных операционных системах. Весь текст, содержащийся в таком файле, имеет удобочитаемый формат и представлен последовательностью символов.
Читать далее