Почему стоит выбрать Aspose.OCR для Java?

Откройте для себя безупречный мир Aspose.OCR для Java — мощного, простого в использовании и экономичного API OCR. Используя менее 5 строк кода Java, добавьте в свои приложения функции распознавания текста, не углубляясь в сложную математику или нейронные сети. Наш надежный механизм оптического распознавания символов отличается превосходной скоростью и точностью и поддерживает 28 языков, включая латиницу, кириллицу и китайский алфавит. От отсканированных изображений и фотографий со смартфона до снимков экрана и отсканированных PDF-файлов — получайте результаты в популярных форматах документов и обмена данными. Воспользуйтесь преимуществами фильтров предварительной обработки, которые обрабатывают повернутые, перекошенные и зашумленные изображения. Оптимизируйте производительность распознавания и нагрузку на систему, переложив ресурсоемкие задачи на графический процессор.

Illustration ocr

Быстрое и точное распознавание текста

Получите высокоскоростные и точные результаты оптического распознавания символов с помощью нашей передовой технологии Java.

Многоязычная поддержка

Распознавание текста на 28 языках, включая латиницу, кириллицу и китайскую графику.

Поддержка адаптивных изображений

Обрабатывайте изображения из различных источников, таких как сканеры, камеры и смартфоны.

Владение китайскими иероглифами

Распознавайте более 6000 китайских иероглифов с беспрецедентной точностью.

Стили шрифтов и целостность формата

Сохраняйте стили шрифтов и форматирование для точного представления распознанного текста Java.

Пример живого кода

Почувствуйте простоту: преобразуйте изображение в текст с помощью нескольких строк кода Java!

Готов признать Готов признать Перетащите файл сюда или нажмите, чтобы просмотреть *

* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.

Результат распознавания
 

Преобразовать изображение в текст

Изучите больше примеров >
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Java повсюду

Aspose.OCR для Java беспрепятственно работает на любой платформе, поддерживающей Java SE 6.0 или выше – будь то локальный компьютер, веб-сервер или облако.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Поддерживаемые форматы файлов

Aspose.OCR for Java может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.

Изображений

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Пакетное распознавание текста

  • Multi-page PDF
  • ZIP
  • Folder

Результаты распознавания

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Простая установка

Aspose.OCR для Java распространяется в виде легковесного файла Java Archive (JAR) или в виде загружаемого файла с минимальными зависимостями. Просто установите его в свой проект, и все готово для распознавания текстов на нескольких поддерживаемых языках и сохранения результатов распознавания в различных форматах.

Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.

Ява, везде

Наша библиотека полностью поддерживает Java SE 6 или более позднюю версию, что позволяет вашим приложениям беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.

28 языков распознавания

Наш Java OCR API распознает множество языков и популярных письменных сценариев, включая смешанные языки:

Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.

  • Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
  • Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
  • Более 6000 китайских иероглифов;
  • Хинди.

Расширение возможностей и возможностей

Aspose.OCR for Java Изучите расширенные функции и возможности Aspose.OCR для Java.

Feature icon

Распознавание фотографий

Извлекайте текст из фотографий смартфона с точностью на уровне сканирования.

Feature icon

PDF с возможностью поиска

Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.

Feature icon

Распознавание URL-адресов

Распознайте изображение по URL-адресу, не загружая его локально.

Feature icon

Массовое распознавание

Читать все изображения из многостраничных документов, папок и архивов.

Feature icon

Любой шрифт и стиль

Идентифицируйте и распознавайте текст во всех популярных шрифтах и ​​стилях.

Feature icon

Точная настройка распознавания

Настройте каждый параметр OCR для достижения наилучших результатов распознавания.

Feature icon

Программа проверки орфографии

Улучшайте результаты, автоматически исправляя слова с ошибками.

Feature icon

Найти текст в изображениях

Поиск текста или регулярного выражения в наборе изображений.

Feature icon

Сравните тексты изображений

Сравнивайте тексты на двух изображениях независимо от регистра и макета.

Feature icon

Распознавание изображений веб-ссылок

Легко распознавайте изображения непосредственно по веб-ссылкам, улучшая интеграцию оптического распознавания символов в ваши проекты Java.

Feature icon

Автоматическое исправление слов с ошибками

Улучшите результаты распознавания, автоматически исправляя слова с ошибками, обеспечивая точность в ваших приложениях Java.

Feature icon

Полная интеграция с экосистемой Aspose

Интегрируйте Aspose.OCR для Java с другими продуктами Aspose, чтобы получить комплексное и эффективное решение для Java.

Примеры кода

Изучите примеры кода, чтобы узнать, как легко интегрировать Aspose.OCR для Java в ваши приложения.

Монтаж

Aspose.OCR для Java легко распространяется в виде файла Java Archive (JAR) с минимальными зависимостями или из репозитория Maven. Интеграция в ваш проект непосредственно из предпочитаемой вами интегрированной среды разработки Java (IDE) — это простой процесс. Просто установите его, и вы будете готовы использовать весь спектр возможностей OCR, сохраняя результаты распознавания в любом из поддерживаемых форматов.

После установки вы можете сразу начать использовать Aspose.OMR для Java , хотя и с некоторыми ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, которое позволит вам принять обоснованное решение о покупке Aspose.OCR для Java на более позднем этапе.

Распознавание текста на отсканированных изображениях в Java

Решите проблему, связанную с отсутствием широко распространенных сканеров в приложениях оптического распознавания символов. Наш API может похвастаться мощными встроенными фильтрами предварительной обработки изображений, которые умело обрабатывают повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений он обеспечивает надежное распознавание даже фотографий со смартфона. Большая часть предварительной обработки и коррекции изображений автоматизирована и требует вашего вмешательства только в сложных случаях.

Применить автоматическую коррекцию изображения — Java

// Create instance of OCR API
AsposeOCR api = new AsposeOCR();

// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));

// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);

// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);

Извлечение текста из фотографий в Java

Интегрируйте обнаружение и распознавание текста в свои приложения Java. С легкостью получайте точные результаты по фотографиям, расширяя возможности обработки изображений. Расширьте возможности обработки изображений, получая точные результаты из фотографий.

Обнаружение и распознавание текста на фотографии – Java

// Add a photo to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");

// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);

// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
  System.out.println(result.recognition_text);
});

Оптимизация ресурсов в Java

Оптическое распознавание символов требует ресурсов. Наш API предлагает гибкие способы сбалансировать классическую триаду «время-цена-качество». Это позволяет вам ограничить количество потоков, используемых механизмом распознавания. Хотя эта настройка может привести к снижению скорости распознавания, она позволяет выделять ресурсы для параллельных задач, таких как параллельная обработка изображений, операции веб-сервера, управление базами данных или анализ фоновых данных.

  • Выбирайте между тщательным распознаванием и быстрым распознаванием.
  • Укажите количество потоков, выделяемых для распознавания, или разрешите библиотеке автоматически масштабироваться под количество ядер процессора.
  • Освободите процессор, перенеся вычисления на графический процессор.

Балансировка ресурсов

RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);

Быстрое распознавание с минимальной настройкой

Если ваши изображения представляют собой высококачественные сканы без перекосов и искажений, вы можете использовать самый быстрый режим распознавания, потребляющий минимально возможные ресурсы, используя:

Быстрое распознавание OCR — Java

AsposeOCR api = new AsposeOCR();

// Add images to the recognition batch
OcrInput images  = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));

// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
  System.out.println(result);
});