Преобразование изображений и PDF-файлов в текст в Java

Легко создавайте кроссплатформенные приложения Java с возможностями оптического распознавания символов (OCR).

Aspose.OCR для Java позволяет извлекать текст из изображений, скриншотов, определенных областей изображения и создавать PDF-файлы с возможностью поиска из отсканированных файлов на любой платформе, поддерживающей Java. Благодаря мощному, но простому в использовании API даже сложные задачи OCR занимают менее 10 строк кода. Вам не нужно работать с формулами и машинным обучением — библиотека позаботится обо всех технических деталях и выдаст достоверные результаты на 26 языках на основе латиницы и кириллицы , а также китайского языка . OCR API обрабатывает отсканированные изображения, фотографии смартфонов, скриншоты, области изображений и отсканированные PDF-файлы и возвращает результаты в самых популярных форматах документов. Скорость распознавания, точность и производительность могут быть дополнительно улучшены за счет распределения вычислений между несколькими ядрами ЦП и переноса ресурсоемких задач на ГП .

С одного взгляда

Краткий обзор возможностей оптического распознавания символов.

Поддерживаемые шрифты

Arial
Times New Roman
Courier New
Tahoma
Calibri
Verdana

Признание

Все изображение
Области изображения
Архивы и папки

Поддерживаемые языки

английский язык
китайский язык
немецкий язык
французский язык
Словенский язык
испанский язык
чешский язык
Польский язык
румынский язык
голландский язык
русский язык
и еще 10+

Aspose.OCR

Независимость от платформы

Aspose.OCR для Java поддерживает JDK 1.6 и выше.

Плагины

Ruby
PHP
IntelliJ IDEA - Maven

Java Runtime Environment

JSP/JSF-приложения
Настольные приложения

Aspose.OCR

Поддерживаемые форматы файлов

Конвертируйте любой файл, полученный со сканера или камеры, в самые популярные форматы обмена документами и данными.

Исходные файлы

PDF
JPEG
PNG
TIFF
GIF
BMP

Результаты признания

PDF с возможностью поиска
Microsoft Word
Microsoft Excel
Простой текст
JSON
XML

Aspose.OCR

Особенности и возможности Aspose.OCR для Java

Распознает форматированный текст в отсканированных изображениях и PDF-файлах

Поддерживает все форматы файлов, которые вы можете получить со сканера или камеры.

Читает латиницу и кириллицу

Распознает более 6000 китайских иероглифов

Обнаруживает и распознает все популярные шрифты

Тщательно сохраняет стили шрифтов и форматирование

Обрабатывает все изображение или только выбранные области

Поддерживает повернутые, перекошенные и зашумленные изображения

Пакетное распознавание всех изображений в папке или архиве

Распознает изображения, предоставленные как веб-ссылки

Находит и автоматически исправляет слова с ошибками

100% совместимость с другими продуктами Aspose

Простота установки

Вы можете использовать Aspose.OCR для Java непосредственно из проекта на основе Maven , следуя простым инструкциям по установке .

Запросите временную лицензию , чтобы начать создание полнофункционального приложения OCR без каких-либо ограничений и ограничений.

$Easy to Use$

Для распознавания изображений требуется пара строк кода. Буквально. Это действительно так просто - попробуйте сами:

Изображение в текст в 7 строк - Java

// Создать экземпляр OCR API
AsposeOCR api = new AsposeOCR();

try {
    // Распознать изображение
    String result = api.RecognizePage(imagePath);
    // Отобразить результат распознавания
    System.out.println("Recognized text: " + result);
} catch (IOException e) {
    // Обработка ошибок
    e.printStackTrace();
}

26 языков распознавания

OCR API поддерживает большое количество языков и все популярные сценарии написания, включая тексты на смешанных языках. Встроенная проверка орфографии автоматически заменяет слова с ошибками и избавляет вас от необходимости вручную исправлять результаты распознавания.

Расширенный латинский алфавит : хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский.
Кириллица : белорусский, болгарский, казахский, русский, сербский, украинский.
Китайский : более 6000 символов.

Вы можете указать язык, чтобы повысить производительность и надежность распознавания, или позволить API автоматически определять языки.

Сохранить форматирование

OCR API считывает все популярные шрифты, такие как Arial, Times New Roman, Courier New, Tahoma, Calibri и другие, в обычном, полужирном и курсивном стилях и тщательно сохраняет форматирование в результатах OCR. Вы также можете разделить результаты распознавания на строки и обнаружить текстовые области на странице.

Распознавать фотографии

Сканер не всегда доступен на рабочих станциях конечных пользователей, что может стать препятствием для приложений OCR. Наш OCR API предоставляет ряд фильтров предварительной обработки, которые могут обрабатывать искаженные, повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений он позволяет надежно распознавать даже фотографии со смартфона. Большая часть предварительной обработки и коррекции изображения выполняется автоматически, но в сложных случаях всегда можно вмешаться.

Применение коррекции изображения — Java

// Создать экземпляр OCR API
AsposeOCR api = new AsposeOCR();

// Определение фильтров предварительной обработки
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Предварительная обработка изображения перед распознаванием
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Распознать изображение
RecognitionResult result = api.RecognizePage(imageRes, set);

Оптимизация производительности

Оптическое распознавание символов требует много вычислительных ресурсов, что может стать проблемой для веб-сервисов и устройств начального уровня. API предлагает очень гибкие способы сбалансировать скорость распознавания, требования к ресурсам и точность:

Выбирайте между тщательным распознаванием и быстрым распознаванием.
Укажите количество потоков, выделенных для распознавания, или разрешите библиотеке автоматически масштабироваться под количество ядер ЦП.
Освободите ЦП, перенеся вычисления на ГП.

Быстрое распознавание — Java

// Создать экземпляр OCR API
AsposeOCR api = new AsposeOCR();

// Распознавать изображения в самом быстром режиме
String result = api.RecognizePageFast("sample.jpg");

Пакетная обработка

OCR API избавляет вас от необходимости распознавать каждое изображение по одному, предлагая различные методы пакетной обработки, которые позволяют распознавать несколько изображений за один вызов:

Распознавание многостраничных файлов PDF и TIFF.
Распознавание всех файлов в архиве.
Распознавание всех файлов в папке.

Support and Learning Resources

Почему Aspose.OCR для Java?
Список клиентов
Истории успеха

Download Free Trial Pricing Information

Aspose также предлагает нативные API-интерфейсы OCR для других популярных языков программирования:

Преобразование изображений и PDF-файлов в текст в Java

Легко создавайте кроссплатформенные приложения Java с возможностями оптического распознавания символов (OCR).

Aspose.OCR for Java

Overview

С одного взгляда

Независимость от платформы

Поддерживаемые форматы файлов

Особенности и возможности Aspose.OCR для Java

Простота установки

$Easy to Use$

Изображение в текст в 7 строк - Java

26 языков распознавания

Сохранить форматирование

Распознавать фотографии

Применение коррекции изображения — Java

Оптимизация производительности

Быстрое распознавание — Java

Пакетная обработка

Support and Learning Resources

Aspose.OCR for.NET

Aspose.OCR forC++