обрабатывает отсканированные изображения или даже фотографии со смартфона в формате TIFF и создает документы TIFF, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно получить Aspose.OCR
Maven или укажите конфигурацию репозитория Aspose Maven. и установите его в своем проекте на основе Maven, добавив следующие конфигурации в файл pom.xml. Примеры Gradle, Ivy, Sbt можно найти в нашем [репозитории] ( https://repository.aspose.com/ocr/ ) .
Package Manager Console Command
PM> Install-Package Aspose.OCR.Cpp
С помощью C++ OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение TIFF в документ PDF:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.asposeocr_page()
- Передайте путь к файлу TIFF в качестве параметра
- AsposeOCR.asposeocr_page возвращает строку или файл типа PDF
Системные Требования
Перед запуском примера убедитесь, что в проект добавлен Microsoft.ML.OnnxRuntime 1.7.0 или более поздней версии. Он должен быть установлен автоматически, если вы устанавливаете Aspose.OCR через диспетчер пакетов NuGet.
- Решение, совместимое с NET Standard 2.0+
- Aspose.OCR для .NET, указанный в вашем проекте.
std::string img_path = "../srcSample.png";
// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;
wchar_t bfr[len] = { 0 };
size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);
//Print result
std::wcout << bfr << L"\n";
TIFF Что такое TIFF Формат файла
TIFF или TIF, Tagged Image File Format, представляет собой растровые изображения, которые предназначены для использования на различных устройствах, соответствующих этому стандарту формата файлов. Он способен описывать двухуровневые, полутоновые, палитры и полноцветные данные изображения в нескольких цветовых пространствах. Он поддерживает схемы сжатия с потерями, а также без потерь, чтобы выбирать между пространством и временем для приложений, использующих формат. Формат является расширяемым и претерпел несколько изменений, что позволяет включать неограниченное количество частной или специальной информации. Формат не зависит от машины и свободен от ограничений, таких как процессор, операционная система или файловые системы.
Читать далееPDF Что такое PDF Формат файла
Portable Document Format (PDF) — это тип документа, созданный Adobe еще в 1990-х годах. Цель этого формата файла состояла в том, чтобы ввести стандарт для представления документов и других справочных материалов в формате, который не зависит от прикладного программного обеспечения, аппаратного обеспечения, а также операционной системы. Формат файла PDF имеет полную возможность содержать такую информацию, как текст, изображения, гиперссылки, поля форм, мультимедийные материалы, цифровые подписи, вложения, метаданные, геопространственные функции и 3D-объекты, которые могут стать частью исходного документа.
Читать далее