Магия OCR: изображение в текст
Преобразование изображений в текст — Java
Другие примеры >// Initialize OCR engine
AsposeOCR api = new AsposeOCR();
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images);
System.out.println(results[0].recognition_text);
Почему стоит выбрать Aspose.OCR для Java?
Откройте для себя безупречный мир Aspose.OCR для Java — мощного, простого в использовании и экономичного API OCR. Используя менее 5 строк кода Java, добавьте в свои приложения функции распознавания текста, не углубляясь в сложную математику или нейронные сети. Наш надежный механизм оптического распознавания символов отличается превосходной скоростью и точностью и поддерживает 28 языков, включая латиницу, кириллицу и китайский алфавит. От отсканированных изображений и фотографий со смартфона до снимков экрана и отсканированных PDF-файлов — получайте результаты в популярных форматах документов и обмена данными. Воспользуйтесь преимуществами фильтров предварительной обработки, которые обрабатывают повернутые, перекошенные и зашумленные изображения. Оптимизируйте производительность распознавания и нагрузку на систему, переложив ресурсоемкие задачи на графический процессор.
![Illustration ocr](https://products.aspose.com/ocr/images/ocr/aspose-ocr.png)
Быстрое и точное распознавание текста
Получите высокоскоростные и точные результаты оптического распознавания символов с помощью нашей передовой технологии Java.
Многоязычная поддержка
Распознавание текста на 28 языках, включая латиницу, кириллицу и китайскую графику.
Поддержка адаптивных изображений
Обрабатывайте изображения из различных источников, таких как сканеры, камеры и смартфоны.
Владение китайскими иероглифами
Распознавайте более 6000 китайских иероглифов с беспрецедентной точностью.
Стили шрифтов и целостность формата
Сохраняйте стили шрифтов и форматирование для точного представления распознанного текста Java.
Live code
Почувствуйте простоту: преобразуйте изображение в текст с помощью нескольких строк кода Java!
* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.
Преобразовать изображение в текст
Изучите больше примеров >AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("image1.png");
images.add("image2.png");
// Recognition language
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Eng);
// Recognize images
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Java повсюду
Aspose.OCR для Java беспрепятственно работает на любой платформе, поддерживающей Java SE 6.0 или выше – будь то локальный компьютер, веб-сервер или облако.
Поддерживаемые форматы файлов
Aspose.OCR for Java может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.
Изображений
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Пакетное распознавание текста
- Multi-page PDF
- ZIP
- Folder
Результаты распознавания
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Простая установка
Aspose.OCR для Java распространяется в виде легковесного файла Java Archive (JAR) или в виде загружаемого файла с минимальными зависимостями. Просто установите его в свой проект, и все готово для распознавания текстов на нескольких поддерживаемых языках и сохранения результатов распознавания в различных форматах.
Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.
Ява, везде
Наша библиотека полностью поддерживает Java SE 6 или более поздней версии, что позволяет вашим приложениям беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.
28 языков распознавания
Наш Java OCR API распознает множество языков и популярных письменных сценариев, включая смешанные языки:
Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.
- Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латвийский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
- Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
- Более 6000 китайских иероглифов;
- Хинди.
Расширение возможностей и возможностей
Aspose.OCR for Java Изучите расширенные функции и возможности Aspose.OCR для Java.
Распознавание фотографий
Извлекайте текст из фотографий смартфона с точностью до уровня сканирования.
PDF с возможностью поиска
Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.
Распознавание URL-адресов
Распознайте изображение по URL-адресу, не загружая его локально.
Массовое распознавание
Читать все изображения из многостраничных документов, папок и архивов.
Любой шрифт и стиль
Идентифицируйте и распознавайте текст во всех популярных шрифтах и стилях.
Точная настройка распознавания
Настройте каждый параметр OCR для достижения наилучших результатов распознавания.
Программа проверки орфографии
Улучшайте результаты, автоматически исправляя слова с ошибками.
Найти текст в изображениях
Поиск текста или регулярного выражения в наборе изображений.
Сравните тексты изображений
Сравнивайте тексты на двух изображениях независимо от регистра и макета.
Распознавание изображений веб-ссылок
Легко распознавайте изображения непосредственно по веб-ссылкам, улучшая интеграцию оптического распознавания символов в ваши проекты Java.
Автоматическое исправление слов с ошибками
Улучшите результаты распознавания, автоматически исправляя слова с ошибками, обеспечивая точность в ваших приложениях Java.
Полная интеграция с экосистемой Aspose
Интегрируйте Aspose.OCR для Java с другими продуктами Aspose, чтобы получить комплексное и эффективное решение для Java.
Примеры кода
Изучите примеры кода, чтобы узнать, как легко интегрировать Aspose.OCR для Java в ваши приложения.
Монтаж
После установки вы можете сразу начать использовать Aspose.OMR для Java , хотя и с некоторыми ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, что позволит вам принять обоснованное решение о покупке Aspose.OCR для Java на более позднем этапе.
Распознавание текста на отсканированных изображениях в Java
Решите проблему, связанную с отсутствием широко распространенных сканеров в приложениях оптического распознавания символов. Наш API может похвастаться мощными встроенными фильтрами предварительной обработки изображений, которые умело обрабатывают повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений он обеспечивает надежное распознавание даже фотографий со смартфона. Большая часть предварительной обработки и коррекции изображений автоматизирована и требует вашего вмешательства только в сложных случаях.
Применить автоматическую коррекцию изображения — Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Define pre-processing filters
PreprocessingFilter filters = new PreprocessingFilter();
filters.add(PreprocessingFilter.ToGrayscale());
filters.add(PreprocessingFilter.Rotate(-90));
// Pre-process image before recognition
BufferedImage imageRes = api.PreprocessImage(imagePath, filters);
// Recognize image
RecognitionResult result = api.RecognizePage(imageRes, set);
Извлечение текста из фотографий в Java
Интегрируйте обнаружение и распознавание текста в свои приложения Java. С легкостью получайте точные результаты по фотографиям, расширяя возможности обработки изображений. Расширьте возможности обработки изображений, получая точные результаты из фотографий.
Обнаружение и распознавание текста на фотографии – Java
// Add a photo to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add("photo.jpg");
// Set photo recognition mode
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setDetectAreasMode(DetectAreasMode.PHOTO);
// Extract text from a photo
ArrayList<RecognitionResult> results = api.Recognize(images, recognitionSettings);
results.forEach((result) -> {
System.out.println(result.recognition_text);
});
Оптимизация ресурсов в Java
Оптическое распознавание символов требует ресурсов. Наш API предлагает гибкие способы сбалансировать классическую триаду «время-цена-качество». Это позволяет вам ограничить количество потоков, используемых механизмом распознавания. Хотя эта настройка может привести к снижению скорости распознавания, она позволяет выделять ресурсы для параллельных задач, таких как параллельная обработка изображений, операции веб-сервера, управление базами данных или анализ фоновых данных.
- Выбирайте между тщательным распознаванием и быстрым распознаванием.
- Укажите количество потоков, выделяемых для распознавания, или разрешите библиотеке автоматически масштабироваться под количество ядер процессора.
- Освободите процессор, перенеся вычисления на графический процессор.
Балансировка ресурсов
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setThreadsCount(2);
Быстрое распознавание с минимальной настройкой
Если ваши изображения представляют собой высококачественные сканы без перекосов и искажений, вы можете использовать самый быстрый режим распознавания, потребляющий минимально возможные ресурсы, используя:
Быстрое распознавание OCR — Java
AsposeOCR api = new AsposeOCR();
// Add images to the recognition batch
OcrInput images = new OcrInput(InputType.SingleImage);
images.add(os.path.join(self.dataDir, "source1.png"));
images.add(os.path.join(self.dataDir, "source2.png"));
// Fast recognize images
ArrayList<RecognitionResult> results = api.RecognizeFast(images);
results.forEach((result) -> {
System.out.println(result);
});