Преобразование изображений и PDF-файлов в текст на C++
Добавьте оптическое распознавание символов (OCR) в свои приложения C++ с помощью нескольких строк кода.
Download Free TrialAspose.OCR для C++ расширяет ваши приложения возможностями оптического распознавания символов в 5 строках кода. Наш опыт в области нейронных сетей и машинного обучения был воплощен в библиотеке OCR с превосходной производительностью и точностью, которая поддерживает 26 языков на основе латиницы и кириллицы , а также китайский язык . OCR API может распознавать отсканированные изображения, фотографии смартфонов, скриншоты, области изображений и отсканированные PDF-файлы и возвращать результаты в самых популярных форматах обмена документами и данными. Он полностью автономен и не требует подключения к Интернету для работы. API требует минимальных усилий для начала работы и неглубокого обучения для освоения. Вся предварительная обработка, коррекция перекоса, удаление шума, определение языка, многопоточность и другие сложные задачи выполняются автоматически, но их можно настроить для работы в сложных случаях.
Расширенные функции C++ OCR API
Извлекает текст из изображений и создает PDF-файлы с возможностью поиска
Поддерживает любое изображение, которое вы можете получить со сканера или камеры
Читает расширенную латиницу и кириллицу
Распознает более 6000 китайских иероглифов
Обнаруживает и распознает все популярные шрифты и форматирование
Предварительно обрабатывает изображения перед распознаванием
Обрабатывает все изображение или только выбранные области
Поддерживает повернутые, перекошенные и зашумленные изображения
Пакетное распознавание всех изображений в папке или архиве
Распознает изображения, предоставленные как веб-ссылки
Находит и автоматически исправляет слова с ошибками
Получить результат распознавания в формате JSON
Легко использовать
Вы все еще думаете, что C++ OCR — это сложно? С нашей библиотекой вам нужно всего 5 строк кода, чтобы распознать изображение и отобразить результат. Попробуйте этот код и убедитесь сами:
Изображение в текст в 5 строк - С++
// Укажите путь к изображению
std::string image_path = "../Data/Source/sample.png";
// Подготовить буфер для результата
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Сделай волшебство
size_t size = aspose::ocr::page(image_path.c_str(), buffer, len);
// Отобразить результат распознавания
std::wcout << buffer << L"\n";
26 языков распознавания
OCR API может распознавать большое количество языков и все популярные сценарии письма, включая тексты на смешанных языках.
- Расширенный латинский алфавит : хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский.
- Кириллица : белорусский, болгарский, казахский, русский, сербский, украинский.
- Китайский : более 6000 символов.
Вы можете оставить определение языка библиотеке или определить язык самостоятельно, чтобы повысить производительность и надежность распознавания.
Пакетная обработка
OCR API освобождает вас от необходимости распознавать каждое изображение по одному, предлагая различные методы пакетной обработки, которые позволяют распознавать несколько изображений за один вызов:
- Распознавание многостраничных файлов PDF и TIFF.
- Распознавание всех файлов в папке.
- Распознавание всех файлов в архиве.
Распознать ZIP-архив - C++
// Укажите путь к архиву
std::string archive_path = "book.zip";
// Подготовить буфер для результата
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Инициализировать объект RecognitionSettings со значениями по умолчанию
RecognitionSettings settings;
// Распознавать
size_t res_len = aspose::ocr::pages_multi(archive_path.c_str(), buffer, len, settings);
Сохранить форматирование
Библиотека OCR считывает все популярные шрифты, такие как Arial, Times New Roman, Courier New, Tahoma, Calibri и другие, в обычном, полужирном и курсивном стилях и тщательно сохраняет форматирование в результатах OCR. Вы также можете разделить результаты распознавания на строки и обнаружить текстовые области на странице.
Распознавать фотографии
Широкое распространение приложений OCR обычно останавливает тот факт, что сканеры не являются обычным явлением для большинства пользователей. Наша библиотека OCR имеет мощные встроенные фильтры предварительной обработки изображений, которые могут обрабатывать темные, повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений он позволяет надежно распознавать даже фотографии со смартфона. Большая часть предварительной обработки и коррекции изображения выполняется автоматически, поэтому вам придется вмешиваться только в сложных случаях.
Установить пользовательский угол для коррекции перекоса — C++
// Исходное изображение
std::string image_path = "../Data/Source/sample.png";
rect rectangles[2] = { {90, 186, 775, 95} , { 928, 606, 790, 160 } };
// Подготовить буфер для результата
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
// Отрегулируйте угол наклона
RecognitionSettings settings;
settings.format = export_format::text;
settings.rectangles = rectangles;
settings.rectangles_size = 2;
settings.skew = 5;
// Распознать изображение
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
Проверка орфографии
Хотя OCR дает надежные результаты, пыль и дефекты печати могут привести к неправильному распознаванию некоторых символов. OCR API имеет встроенную проверку орфографии, которая автоматически заменяет слова с ошибками и избавляет вас от необходимости вручную исправлять результаты распознавания.
Support and Learning Resources
- Образовательные ресурсы
- Документация
- Исходный код
- Ссылки на API
- Учебные видео
- Поддержка продукта
- Бесплатная поддержка
- Платная поддержка
- Блог
- Примечания к выпуску
- Почему Aspose.OCR для C++?
- Список клиентов
- Истории успеха