Aspose.OCR  for Java

Преобразование изображений и PDF-файлов в текст в Java

Легко создавайте кроссплатформенные приложения Java с возможностями оптического распознавания символов (OCR).

  Download Free Trial
  
 

Aspose.OCR для Java позволяет извлекать текст из изображений, скриншотов, определенных областей изображения и создавать PDF-файлы с возможностью поиска из отсканированных файлов на любой платформе, поддерживающей Java. Благодаря мощному, но простому в использовании API даже сложные задачи OCR занимают менее 10 строк кода. Вам не нужно работать с формулами и машинным обучением — библиотека позаботится обо всех технических деталях и выдаст достоверные результаты на 26 языках на основе латиницы и кириллицы , а также китайского языка . OCR API обрабатывает отсканированные изображения, фотографии смартфонов, скриншоты, области изображений и отсканированные PDF-файлы и возвращает результаты в самых популярных форматах документов. Скорость распознавания, точность и производительность могут быть дополнительно улучшены за счет распределения вычислений между несколькими ядрами ЦП и переноса ресурсоемких задач на ГП .

Особенности и возможности Aspose.OCR для Java

Распознает форматированный текст в отсканированных изображениях и PDF-файлах

Поддерживает все форматы файлов, которые вы можете получить со сканера или камеры.

Читает латиницу и кириллицу

Распознает более 6000 китайских иероглифов

Обнаруживает и распознает все популярные шрифты

Тщательно сохраняет стили шрифтов и форматирование

Обрабатывает все изображение или только выбранные области

Поддерживает повернутые, перекошенные и зашумленные изображения

Пакетное распознавание всех изображений в папке или архиве

Распознает изображения, предоставленные как веб-ссылки

Находит и автоматически исправляет слова с ошибками

100% совместимость с другими продуктами Aspose

Простота установки

Вы можете использовать Aspose.OCR для Java непосредственно из проекта на основе Maven , следуя простым инструкциям по установке .

Запросите временную лицензию , чтобы начать создание полнофункционального приложения OCR без каких-либо ограничений и ограничений.

$Easy to Use$

Для распознавания изображений требуется пара строк кода. Буквально. Это действительно так просто - попробуйте сами:

Изображение в текст в 7 строк - Java

// Создать экземпляр OCR API
AsposeOCR api = new AsposeOCR();

try {
    // Распознать изображение
    String result = api.RecognizePage(imagePath);
    // Отобразить результат распознавания
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // Обработка ошибок
    e.printStackTrace();
}

26 языков распознавания

OCR API поддерживает большое количество языков и все популярные сценарии написания, включая тексты на смешанных языках. Встроенная проверка орфографии автоматически заменяет слова с ошибками и избавляет вас от необходимости вручную исправлять результаты распознавания.

  • Расширенный латинский алфавит : хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский.
  • Кириллица : белорусский, болгарский, казахский, русский, сербский, украинский.
  • Китайский : более 6000 символов.

Вы можете указать язык, чтобы повысить производительность и надежность распознавания, или позволить API автоматически определять языки.

Сохранить форматирование

OCR API считывает все популярные шрифты, такие как Arial, Times New Roman, Courier New, Tahoma, Calibri и другие, в обычном, полужирном и курсивном стилях и тщательно сохраняет форматирование в результатах OCR. Вы также можете разделить результаты распознавания на строки и обнаружить текстовые области на странице.

Распознавать фотографии

Сканер не всегда доступен на рабочих станциях конечных пользователей, что может стать препятствием для приложений OCR. Наш OCR API предоставляет ряд фильтров предварительной обработки, которые могут обрабатывать искаженные, повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений он позволяет надежно распознавать даже фотографии со смартфона. Большая часть предварительной обработки и коррекции изображения выполняется автоматически, но в сложных случаях всегда можно вмешаться.

Применение коррекции изображения — Java

// Создать экземпляр OCR API
AsposeOCR api = new AsposeOCR();

// Определение фильтров предварительной обработки
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Предварительная обработка изображения перед распознаванием
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Распознать изображение
RecognitionResult result = api.RecognizePage(imageRes, set);

Оптимизация производительности

Оптическое распознавание символов требует много вычислительных ресурсов, что может стать проблемой для веб-сервисов и устройств начального уровня. API предлагает очень гибкие способы сбалансировать скорость распознавания, требования к ресурсам и точность:

  • Выбирайте между тщательным распознаванием и быстрым распознаванием.
  • Укажите количество потоков, выделенных для распознавания, или разрешите библиотеке автоматически масштабироваться под количество ядер ЦП.
  • Освободите ЦП, перенеся вычисления на ГП.

Быстрое распознавание — Java

// Создать экземпляр OCR API
AsposeOCR api = new AsposeOCR();

// Распознавать изображения в самом быстром режиме
String result = api.RecognizePageFast("sample.jpg");

Пакетная обработка

OCR API избавляет вас от необходимости распознавать каждое изображение по одному, предлагая различные методы пакетной обработки, которые позволяют распознавать несколько изображений за один вызов:

  • Распознавание многостраничных файлов PDF и TIFF.
  • Распознавание всех файлов в архиве.
  • Распознавание всех файлов в папке.
  
  

Aspose также предлагает нативные API-интерфейсы OCR для других популярных языков программирования: