HTML JPG OCR XML BMP
Aspose.OCR  для C++
XLS

Aspose.Imaging для Java

обрабатывает отсканированные изображения или даже фотографии со смартфона в формате PDF и создает документы PDF, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно получить Aspose.OCR

Maven или укажите конфигурацию репозитория Aspose Maven. и установите его в своем проекте на основе Maven, добавив следующие конфигурации в файл pom.xml. Примеры Gradle, Ivy, Sbt можно найти в нашем [репозитории] ( https://repository.aspose.com/ocr/ ) .

Package Manager Console Command


  PM> Install-Package Aspose.OCR.Cpp

С помощью C++ OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение PDF в документ XLS:

  • Создать экземпляр класса AsposeOcr
  • Вызов метода AsposeOCR.asposeocr_page()
  • Передайте путь к файлу PDF в качестве параметра
  • AsposeOCR.asposeocr_page возвращает строку или файл типа XLS

Системные Требования

Перед запуском примера убедитесь, что в проект добавлен Microsoft.ML.OnnxRuntime 1.7.0 или более поздней версии. Он должен быть установлен автоматически, если вы устанавливаете Aspose.OCR через диспетчер пакетов NuGet.

  • Решение, совместимое с NET Standard 2.0+
  • Aspose.OCR для .NET, указанный в вашем проекте.


std::string img_path = "../srcSample.png";

// Prepare buffer for result (in symbols, len_byte = len * sizeof(wchar_t))
const size_t len = 4096;

wchar_t bfr[len] = { 0 };

size_t result = aspose::ocr::page(image_path.c_str(), bfr, len);

//Print result
std::wcout << bfr << L"\n";
  • PDF Что такое PDF Формат файла

    Portable Document Format (PDF) — это тип документа, созданный Adobe еще в 1990-х годах. Цель этого формата файла состояла в том, чтобы ввести стандарт для представления документов и других справочных материалов в формате, который не зависит от прикладного программного обеспечения, аппаратного обеспечения, а также операционной системы. Формат файла PDF имеет полную возможность содержать такую ​​информацию, как текст, изображения, гиперссылки, поля форм, мультимедийные материалы, цифровые подписи, вложения, метаданные, геопространственные функции и 3D-объекты, которые могут стать частью исходного документа.

    Читать далее

    XLS Что такое XLS Формат файла

    Файлы с расширением XLS представляют собой формат двоичных файлов Excel. Такие файлы могут быть созданы Microsoft Excel, а также другими подобными программами для работы с электронными таблицами, такими как OpenOffice Calc или Apple Numbers. Файл, сохраненный Excel, известен как рабочая книга, где каждая рабочая книга может иметь один или несколько рабочих листов. Данные хранятся и отображаются для пользователей в формате таблицы на листе и могут включать числовые значения, текстовые данные, формулы, подключения к внешним данным, изображения и диаграммы. Такие приложения, как Microsoft Excel, позволяют экспортировать данные рабочей книги в несколько различных форматов, включая PDF, CSV, XLSX, TXT, HTML, XPS и некоторые другие. Формат файла XLS был заменен более открытым и структурированным форматом XLSX с выпуском Microsoft Excel 2007. Последние версии по-прежнему поддерживают создание и чтение файлов XLS, хотя XLSX сейчас используется в первую очередь.

    Читать далее