обрабатывает отсканированные изображения или даже фотографии со смартфона в формате WBMP и создает документы WBMP, содержащие распознанный текст. Чтобы добавить его в свой проект, вам просто нужно получить Aspose.OCR
Maven или укажите конфигурацию репозитория Aspose Maven. и установите его в своем проекте на основе Maven, добавив следующие конфигурации в файл pom.xml. Примеры Gradle, Ivy, Sbt можно найти в нашем [репозитории] ( https://repository.aspose.com/ocr/ ) .
Maven Dependency
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>22.5</version>
</dependency>
С помощью Java OCR и всего нескольких строк кода вы можете создать полнофункциональное приложение, которое преобразует изображение WBMP в документ PDF:
- Создать экземпляр класса AsposeOcr
- Вызов метода AsposeOCR.RecognizePage
- Передайте путь к файлу WBMP в качестве параметра
- AsposeOCR.RecognizePage возвращает строку или файл типа PDF
Системные Требования
Перед запуском примера убедитесь, что в вашей системе установлена платформа Java 2 Standard Edition (J2SE) 6.0 (1.6) или более поздней версии.
- Установлен JDK 1.6 или выше.
//Create API instance
AsposeOCR api = new AsposeOCR();
//Prepare rectangles with texts.
ArrayList rectArray = new ArrayList();
rectArray.add(new Rectangle(138, 352, 2033, 537));
rectArray.add(new Rectangle(147, 890, 2033, 1157));
String result = api.RecognizePage("srcImage.png", rectArray);
System.out.println("Result with rect: " + result);
WBMP Что такое WBMP Формат файла
WBMP — это формат файла монохромной графики, оптимизированный для мобильных вычислительных устройств. Изображения WBMP являются монохромными (черно-белыми), поэтому размер изображения сведен к минимуму. Черный пиксель обозначается 0, а белый пиксель обозначается 1.
Читать далееPDF Что такое PDF Формат файла
Portable Document Format (PDF) — это тип документа, созданный Adobe еще в 1990-х годах. Цель этого формата файла состояла в том, чтобы ввести стандарт для представления документов и других справочных материалов в формате, который не зависит от прикладного программного обеспечения, аппаратного обеспечения, а также операционной системы. Формат файла PDF имеет полную возможность содержать такую информацию, как текст, изображения, гиперссылки, поля форм, мультимедийные материалы, цифровые подписи, вложения, метаданные, геопространственные функции и 3D-объекты, которые могут стать частью исходного документа.
Читать далее