OCR for Java

OCR for C++

OCR for Python via .NET

OCR for Python via C++

OCR for Javascript via C++

OCR for Node.js via C++

OCR for Python via Java

Мастерство преобразования изображений в текст с помощью Python через Java

Раскройте возможности оптического распознавания символов в Python, используя наш многофункциональный Aspose.OCR для Python через библиотеку Java. Легко конвертируйте изображения и PDF-файлы в редактируемый текст.

Скачать Попробовать Купить

Посмотрите, что нового

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

> pip install aspose-ocr-python-java or
download

Почему Aspose.OCR для Python через Java?

Aspose.OCR для Python через Java легко интегрирует мощные возможности оптического распознавания символов (OCR) в ваши кроссплатформенные ноутбуки и приложения Python. Благодаря нашему интуитивно понятному и высокоскоростному API вы можете легко извлекать текст из сканированных изображений, снимков экрана, веб-ссылок или фотографий со смартфона, получая результаты, готовые для консолидации, анализа или хранения. Распознавайте отсканированные изображения, фотографии со смартфона, снимки экрана и отсканированные PDF-файлы, сохраняя результаты в популярных форматах документов. Расширенные фильтры предварительной обработки обрабатывают повернутые, перекошенные и зашумленные изображения. Оптимизируйте производительность, переложив задачи на графический процессор.

Быстрое и точное распознавание текста

Достигайте высокоскоростных и точных результатов оптического распознавания символов с помощью нашей передовой технологии Python через Java.

Многоязычная поддержка

Распознавайте текст на 28 языках, включая латиницу, кириллицу и китайскую письменность, обеспечивая универсальность для ваших приложений Python через Java.

Гибкая поддержка изображений

Легко обрабатывайте изображения со сканеров, камер и смартфонов с помощью Python через Java.

Точность распознавания китайских символов

Точно распознавайте более 6000 китайских иероглифов в своих проектах Python с помощью Java.

Сохранение стилей шрифтов и форматирования

Сохраняйте стили шрифтов и форматирование для точного представления распознанного текста в ваших приложениях Python через Java.

Live code

Запустите распознавание текста на изображениях всего за три строки кода. Почувствуйте простоту!

Извлечь текст Извлечь текст Перетащите файл сюда или нажмите, чтобы просмотреть *

* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.

Результат распознавания

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Выберите платформу

Выберите билиотеку, которая лучше всего подходит для ваших нужд.

Python via .NET

Удобная разработка и легко читаемый код

Самый широкий функционал

Может быть немного медленней, чем другие библиотеки

Python via Java

Используйте единую библиотеку на любой платформе

Запускайте ваше приложение на любом устройстве

Требуется Java Runtime Environment (JRE) 8 или новее

Python via C++

Гарантированная скрость на любой платформе

Гибкое управление ресурсами и производительностью

Ориентировано на опытных разработчиков

Совместимость с серверной частью Java

Наша библиотека, разработанная как модуль Python, обеспечивает совместимость с основными операционными системами, поддерживающими Java , включая Microsoft Windows, Linux и macOS или облачные платформы. Это позволяет разрабатывать приложения на одной платформе и беспрепятственно запускать их на другой, устраняя необходимость каких-либо модификаций кода.

Поддерживаемые форматы файлов

Aspose.OCR for Python via Java может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.

Изображений

PDF
JPEG
PNG
TIFF
GIF
Bitmap

Пакетное распознавание текста

Multi-page PDF
ZIP
Folder

Результаты распознавания

Text
PDF
Microsoft Word
Microsoft Excel
HTML
RTF
ePub
JSON
XML

Простая установка Python через Java

Aspose.OCR для Python через Java поставляется в виде пакета Python или загружаемого файла с минимальными зависимостями. Легко установите в свой проект, и вы будете готовы распознавать тексты на нескольких поддерживаемых языках и сохранять результаты распознавания в различных форматах.

Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.

Мощное распознавание текста для приложений Python

Наша библиотека легко интегрируется, позволяя приложениям Python беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.

28 языков распознавания

Наш API OCR для Python и Java распознает множество языков и популярных письменных сценариев, включая смешанные языки:

Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.

Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латвийский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
Китайский: более 6000 символов;
Хинди.

Расширенные фильтры обработки изображений

Точность оптического распознавания символов во многом зависит от качества исходного изображения. Aspose.OCR для Python через Java предлагает широкий набор фильтров автоматической и ручной обработки изображений для оптимизации изображения перед отправкой в механизм OCR:

Автоматически выпрямляет слегка наклоненные изображения.
Вручную исправьте поворот сильно перекошенных изображений.
Автоматически удаляйте грязь, пятна, царапины, блики, нежелательные градиенты и другие типы шума.
Автоматическая регулировка контрастности изображения.
Автоматически увеличивайте масштаб или изменяйте размер изображения вручную.
Преобразуйте изображения в черно-белые или в оттенках серого.
Инвертируйте цвета изображения, делая светлые области темными, а темные — светлыми.
Увеличьте толщину символов на изображении.
Размытие шумных изображений, сохраняя края букв.
Выпрямите перекос страницы и исправьте искажение объектива камеры на фотографиях страниц.

Специализированные API для различных типов документов.

Aspose.OCR for Python через Java предлагает специально обученные нейронные сети для извлечения текста из определенных типов изображений с максимальной точностью:

Отсканированные или сфотографированные удостоверения личности и паспорта.
Номерные знаки транспортных средств.
Счета-фактуры.
Квитанции.

Встроенная проверка орфографии.

Хотя Aspose.OCR for Python через Java обеспечивает высокую точность распознавания, дефекты печати, грязь или нестандартные шрифты могут привести к неправильному распознаванию определенных символов или слов. Для дальнейшего улучшения результатов распознавания вы можете включить проверку орфографии, которая находит и автоматически исправляет орфографические ошибки на основе выбранного языка распознавания.

Если распознанный текст содержит специализированную терминологию, сокращения и другие слова, которых нет в общепринятых орфографических словарях, вы можете предоставить свои списки слов.

Эффективное распознавание партий

Наш API-интерфейс Python OCR позволяет упростить распознавание изображений. Используйте универсальные методы пакетной обработки для эффективной обработки нескольких изображений за один вызов:

Распознавание многостраничных файлов PDF, TIFF.
Обработать все файлы в папке.
Обработка распознавания всех файлов в архиве.
Распознавать изображения из указанного списка.

Обучение с помощью примеров Python

Изучите множество примеров Python , которые помогут вам быстро освоить функции и возможности нашего решения OCR. Быстро получите представление о создании индивидуальных решений, отвечающих конкретным бизнес-требованиям.

Особенности и возможности

Aspose.OCR for Python via Java Изучите расширенные возможности Aspose.OCR для Python

Распознавание фотографий

Извлекайте текст из фотографий смартфона с точностью до уровня сканирования.

PDF с возможностью поиска

Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.

Распознавание URL-адресов

Распознайте изображение по URL-адресу, не загружая его локально.

Массовое распознавание

Читать все изображения из многостраничных документов, папок и архивов.

Любой шрифт и стиль

Идентифицируйте и распознавайте текст во всех популярных шрифтах и стилях.

Точная настройка распознавания

Настройте каждый параметр OCR для достижения наилучших результатов распознавания.

Программа проверки орфографии

Улучшайте результаты, автоматически исправляя слова с ошибками.

Найти текст в изображениях

Поиск текста или регулярного выражения в наборе изображений.

Сравните тексты изображений

Сравнивайте тексты на двух изображениях независимо от регистра и макета.

Примеры кода Python

Откройте для себя примеры кода, позволяющие легко интегрировать Aspose.OCR для Python через Java в ваши приложения.

Простая установка

Aspose.OCR for Python через Java в виде пакета Python или загружаемого файла с минимальными зависимостями обеспечивает легкое распространение. Интегрируйте его в свой проект непосредственно из Python, и вы будете готовы использовать все возможности OCR, сохраняя результаты распознавания в различных форматах.

После установки сразу же начните использовать Aspose.OCR для Python через Java, хотя и с определенными ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, которое позволит вам позже принять обоснованное решение о покупке Aspose.OCR для Python через Java.

Загрузить лицензию

lic = License()
lic.set_license(self.licPath)

Распознавание изображений

Основная проблема приложений оптического распознавания символов — нехватка сканеров для конечных пользователей. Наш API, легко интегрированный с Python через Java, оснащен надежными встроенными фильтрами предварительной обработки изображений, обрабатывающими повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений это обеспечивает надежное распознавание даже фотографий со смартфона. Большая часть предварительной обработки и коррекции изображений автоматизирована и требует вашего вмешательства только в сложных случаях.

Применить автоматическую коррекцию изображения — Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Универсальный конвертер Python

Наш API умело считывает любые изображения со сканеров, камер или смартфонов: документы PDF, файлы JPEG, PNG, TIFF, GIF, BMP. Полная поддержка многостраничных документов PDF, изображений TIFF и DjVu обеспечивает универсальность. Вы также можете предоставить изображение из Интернета по URL-адресу.

Результаты распознавания возвращаются в популярных форматах обмена документами и данными: обычный текст, PDF, Microsoft Word, Microsoft Excel, JSON и XML.

Распознавание PDF и сохранение результатов в различных выходных форматах — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Оптимизация использования ресурсов

OCR предлагает специальный алгоритм распознавания для извлечения контента из изображений с редким текстом и шумным/цветным фоном. Этот метод значительно повышает точность распознавания текста в следующих бизнес-сценариях:

Чтение текста с уличных фотографий.
Сегментируйте и идентифицируйте дорожные знаки и вывески на изображениях улиц.
Найдите ценники и интерпретируйте извлеченный текст как цены.
Находите и объединяйте интересующие вас области на этикетках продуктов питания, например информацию о пищевой ценности или списки ингредиентов.
Определить и проанализировать номерные знаки автомобилей.
Извлечение текста из меню и каталогов.

OCR на открытой местности — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Извлечение текста из уличных фотографий

OCR для Python предлагает специальный алгоритм распознавания, который извлекает текст из номерных знаков транспортных средств, включая темные и размытые фотографии. Полученный текст затем может быть автоматически сохранен в базе данных или автоматически проверен.

Распознать номер автомобиля — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)