Преобразование изображений и PDF-файлов в текст на C++

Добавьте оптическое распознавание символов (OCR) в свои приложения C++ с помощью нескольких строк кода.

Aspose.OCR для C++ расширяет ваши приложения возможностями оптического распознавания символов в 5 строках кода. Наш опыт в области нейронных сетей и машинного обучения был воплощен в библиотеке OCR с превосходной производительностью и точностью, которая поддерживает 26 языков на основе латиницы и кириллицы , а также китайский язык . OCR API может распознавать отсканированные изображения, фотографии смартфонов, скриншоты, области изображений и отсканированные PDF-файлы и возвращать результаты в самых популярных форматах обмена документами и данными. Он полностью автономен и не требует подключения к Интернету для работы. API требует минимальных усилий для начала работы и неглубокого обучения для освоения. Вся предварительная обработка, коррекция перекоса, удаление шума, определение языка, многопоточность и другие сложные задачи выполняются автоматически, но их можно настроить для работы в сложных случаях.

С одного взгляда

Краткий обзор возможностей оптического распознавания символов.

Основные особенности

Извлечение текста из фотографий
Создавайте PDF-файлы с возможностью поиска
Автоматическая коррекция изображения
Поддержка нескольких шрифтов
Сохранить форматирование текста
Обнаружение текстовых фрагментов
Пакетная обработка
Проверка орфографии

Поддерживаемые языки

английский язык
китайский язык
немецкий язык
французский язык
итальянский язык
испанский язык
русский язык
чешский язык
Польский язык
украинский язык
голландский язык
Эстонский язык
и еще 10+

Aspose.OCR

Независимость от платформы

Библиотека OCR полностью поддерживает приложения C++ как для Windows, так и для Linux.

Windows 64 bit

Linux 64 bit

Aspose.OCR

Поддерживаемые форматы файлов

Конвертируйте любой файл, полученный со сканера или камеры, в самые популярные форматы обмена документами и данными.

Исходные файлы

PDF
JPEG
PNG
TIFF
BMP

Результаты признания

PDF с возможностью поиска
Microsoft Word
Microsoft Excel
Простой текст
JSON
XML

Aspose.OCR

Расширенные функции C++ OCR API

Извлекает текст из изображений и создает PDF-файлы с возможностью поиска

Поддерживает любое изображение, которое вы можете получить со сканера или камеры

Читает расширенную латиницу и кириллицу

Распознает более 6000 китайских иероглифов

Обнаруживает и распознает все популярные шрифты и форматирование

Предварительно обрабатывает изображения перед распознаванием

Обрабатывает все изображение или только выбранные области

Поддерживает повернутые, перекошенные и зашумленные изображения

Пакетное распознавание всех изображений в папке или архиве

Распознает изображения, предоставленные как веб-ссылки

Находит и автоматически исправляет слова с ошибками

Получить результат распознавания в формате JSON

Легко использовать

Вы все еще думаете, что C++ OCR — это сложно? С нашей библиотекой вам нужно всего 5 строк кода, чтобы распознать изображение и отобразить результат. Попробуйте этот код и убедитесь сами:

Изображение в текст в 5 строк - С++

// Укажите путь к изображению
std::string image_path = "../Data/Source/sample.png";

// Подготовить буфер для результата
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Сделай волшебство
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);

// Отобразить результат распознавания
std::wcout << buffer << L"\n";

26 языков распознавания

OCR API может распознавать большое количество языков и все популярные сценарии письма, включая тексты на смешанных языках.

Расширенный латинский алфавит : хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский.
Кириллица : белорусский, болгарский, казахский, русский, сербский, украинский.
Китайский : более 6000 символов.

Вы можете оставить определение языка библиотеке или определить язык самостоятельно, чтобы повысить производительность и надежность распознавания.

Пакетная обработка

OCR API освобождает вас от необходимости распознавать каждое изображение по одному, предлагая различные методы пакетной обработки, которые позволяют распознавать несколько изображений за один вызов:

Распознавание многостраничных файлов PDF и TIFF.
Распознавание всех файлов в папке.
Распознавание всех файлов в архиве.

Распознать ZIP-архив - C++

// Укажите путь к архиву
std::string archive_path = "book.zip";

// Подготовить буфер для результата
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Инициализировать объект RecognitionSettings со значениями по умолчанию
RecognitionSettings settings;

// Распознавать
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);

Сохранить форматирование

Библиотека OCR считывает все популярные шрифты, такие как Arial, Times New Roman, Courier New, Tahoma, Calibri и другие, в обычном, полужирном и курсивном стилях и тщательно сохраняет форматирование в результатах OCR. Вы также можете разделить результаты распознавания на строки и обнаружить текстовые области на странице.

Распознавать фотографии

Широкое распространение приложений OCR обычно останавливает тот факт, что сканеры не являются обычным явлением для большинства пользователей. Наша библиотека OCR имеет мощные встроенные фильтры предварительной обработки изображений, которые могут обрабатывать темные, повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений он позволяет надежно распознавать даже фотографии со смартфона. Большая часть предварительной обработки и коррекции изображения выполняется автоматически, поэтому вам придется вмешиваться только в сложных случаях.

Установить пользовательский угол для коррекции перекоса — C++

// Исходное изображение
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };

// Подготовить буфер для результата
const size_t len = 4096;
wchar_t buffer[len] = { 0 };

// Отрегулируйте угол наклона
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;

// Распознать изображение
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);

Проверка орфографии

Хотя OCR дает надежные результаты, пыль и дефекты печати могут привести к неправильному распознаванию некоторых символов. OCR API имеет встроенную проверку орфографии, которая автоматически заменяет слова с ошибками и избавляет вас от необходимости вручную исправлять результаты распознавания.

Support and Learning Resources

Download Free Trial Pricing Information

Aspose также предлагает нативные API-интерфейсы OCR для других популярных языков программирования:

Преобразование изображений и PDF-файлов в текст на C++

Добавьте оптическое распознавание символов (OCR) в свои приложения C++ с помощью нескольких строк кода.

Aspose.OCR for C++

Overview

С одного взгляда

Независимость от платформы

Поддерживаемые форматы файлов

Расширенные функции C++ OCR API

Легко использовать

Изображение в текст в 5 строк - С++

26 языков распознавания

Пакетная обработка

Распознать ZIP-архив - C++

Сохранить форматирование

Распознавать фотографии

Установить пользовательский угол для коррекции перекоса — C++

Проверка орфографии

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forJava