Почему Aspose.OCR для Python через Java?

Aspose.OCR для Python через Java легко интегрирует мощные возможности оптического распознавания символов (OCR) в ваши кроссплатформенные ноутбуки и приложения Python. Благодаря нашему интуитивно понятному и высокоскоростному API вы можете легко извлекать текст из сканированных изображений, снимков экрана, веб-ссылок или фотографий со смартфона, получая результаты, готовые для консолидации, анализа или хранения. Распознавайте отсканированные изображения, фотографии со смартфона, снимки экрана и отсканированные PDF-файлы, сохраняя результаты в популярных форматах документов. Расширенные фильтры предварительной обработки обрабатывают повернутые, перекошенные и зашумленные изображения. Оптимизируйте производительность, переложив задачи на графический процессор.

Illustration ocr

Быстрое и точное распознавание текста

Достигайте высокоскоростных и точных результатов оптического распознавания символов с помощью нашей передовой технологии Python через Java.

Многоязычная поддержка

Распознавайте текст на 28 языках, включая латиницу, кириллицу и китайский алфавит, обеспечивая универсальность для ваших приложений Python через Java.

Гибкая поддержка изображений

Легко обрабатывайте изображения со сканеров, камер и смартфонов с помощью Python через Java.

Точность распознавания китайских символов

Точно распознавайте более 6000 китайских иероглифов в своих проектах Python с помощью Java.

Сохранение стилей шрифтов и форматирования

Сохраняйте стили шрифтов и форматирование для точного представления распознанного текста в ваших приложениях Python через Java.

Пример живого кода

Запустите распознавание текста на изображениях всего за три строки кода. Почувствуйте простоту!

Готов признать Готов признать Перетащите файл сюда или нажмите, чтобы просмотреть *

* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.

Результат распознавания
 

Преобразовать изображение в текст

Больше примеров >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)

# Display the recognition result
print(result[0].recognition_text)

Совместимость с серверной частью Java

Наша библиотека, разработанная как модуль Python, обеспечивает совместимость с основными операционными системами, поддерживающими Java , включая Microsoft Windows, Linux и macOS или облачные платформы. Это позволяет разрабатывать приложения на одной платформе и беспрепятственно запускать их на другой, устраняя необходимость каких-либо модификаций кода.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Поддерживаемые форматы файлов

Aspose.OCR for Python via Java может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.

Изображений

  • PDF
  • JPEG
  • PNG
  • TIFF
  • GIF
  • Bitmap

Пакетное распознавание текста

  • Multi-page PDF
  • ZIP
  • Folder

Результаты распознавания

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Простая установка Python через Java

Aspose.OCR для Python через Java поставляется в виде пакета Python или загружаемого файла с минимальными зависимостями. Легко установите в свой проект, и вы будете готовы распознавать тексты на нескольких поддерживаемых языках и сохранять результаты распознавания в различных форматах.

Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.

Мощное распознавание текста для приложений Python

Наша библиотека легко интегрируется, позволяя приложениям Python беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.

28 языков распознавания

Наш API-интерфейс OCR для Python и Java распознает множество языков и популярных письменных сценариев, включая смешанные языки:

Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.

  • Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
  • Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
  • Китайский: более 6000 символов;
  • Хинди.

Расширенные фильтры обработки изображений

Точность оптического распознавания символов во многом зависит от качества исходного изображения. Aspose.OCR для Python через Java предлагает широкий набор фильтров автоматической и ручной обработки изображений для оптимизации изображения перед отправкой в ​​механизм OCR:

  • Автоматически выпрямляет слегка наклоненные изображения.
  • Вручную исправьте поворот сильно перекошенных изображений.
  • Автоматически удаляйте грязь, пятна, царапины, блики, нежелательные градиенты и другие типы шума.
  • Автоматическая регулировка контрастности изображения.
  • Автоматически увеличивайте масштаб или изменяйте размер изображения вручную.
  • Преобразуйте изображения в черно-белые или в оттенках серого.
  • Инвертируйте цвета изображения, делая светлые области темными, а темные — светлыми.
  • Увеличьте толщину символов на изображении.
  • Размытие шумных изображений, сохраняя края букв.
  • Выпрямите перекос страницы и исправьте искажение объектива камеры на фотографиях страниц.

Специализированные API для различных типов документов.

Aspose.OCR for Python через Java предлагает специально обученные нейронные сети для извлечения текста из определенных типов изображений с максимальной точностью:

  • Отсканированные или сфотографированные удостоверения личности и паспорта.
  • Номерные знаки транспортных средств.
  • Счета-фактуры.
  • Квитанции.

Встроенная проверка орфографии.

Хотя Aspose.OCR for Python через Java обеспечивает высокую точность распознавания, дефекты печати, грязь или нестандартные шрифты могут привести к неправильному распознаванию определенных символов или слов. Для дальнейшего улучшения результатов распознавания вы можете включить проверку орфографии, которая находит и автоматически исправляет орфографические ошибки на основе выбранного языка распознавания.

Если распознанный текст содержит специализированную терминологию, сокращения и другие слова, которых нет в общепринятых орфографических словарях, вы можете предоставить свои списки слов.

Эффективное распознавание партий

Наш API-интерфейс Python OCR позволяет упростить распознавание изображений. Используйте универсальные методы пакетной обработки для эффективной обработки нескольких изображений за один вызов:

  • Распознавание многостраничных файлов PDF, TIFF.
  • Обработать все файлы в папке.
  • Обработка распознавания всех файлов в архиве.
  • Распознавать изображения из указанного списка.

Обучение с помощью примеров Python

Изучите множество примеров Python , которые помогут вам быстро освоить функции и возможности нашего решения OCR. Быстро получите представление о создании индивидуальных решений, отвечающих конкретным бизнес-требованиям.

Особенности и возможности

Aspose.OCR for Python via Java Изучите расширенные возможности Aspose.OCR для Python

Feature icon

Распознавание фотографий

Извлекайте текст из фотографий смартфона с точностью на уровне сканирования.

Feature icon

PDF с возможностью поиска

Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.

Feature icon

Распознавание URL-адресов

Распознайте изображение по URL-адресу, не загружая его локально.

Feature icon

Массовое распознавание

Читать все изображения из многостраничных документов, папок и архивов.

Feature icon

Любой шрифт и стиль

Идентифицируйте и распознавайте текст во всех популярных шрифтах и ​​стилях.

Feature icon

Точная настройка распознавания

Настройте каждый параметр OCR для достижения наилучших результатов распознавания.

Feature icon

Программа проверки орфографии

Улучшайте результаты, автоматически исправляя слова с ошибками.

Feature icon

Найти текст в изображениях

Поиск текста или регулярного выражения в наборе изображений.

Feature icon

Сравните тексты изображений

Сравнивайте тексты на двух изображениях независимо от регистра и макета.

Примеры кода Python

Откройте для себя примеры кода, позволяющие легко интегрировать Aspose.OCR для Python через Java в ваши приложения.

Простая установка

Aspose.OCR for Python через Java в виде пакета Python или загружаемого файла с минимальными зависимостями обеспечивает легкое распространение. Интегрируйте его в свой проект непосредственно из Python, и вы будете готовы использовать все возможности оптического распознавания символов, сохраняя результаты распознавания в различных форматах.

После установки сразу начните использовать Aspose.OCR для Python через Java, хотя и с определенными ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, которое позволит вам позже принять обоснованное решение о покупке Aspose.OCR для Python через Java.

Загрузить лицензию

lic = License()
lic.set_license(self.licPath)

Распознавание изображений

Основная проблема приложений оптического распознавания символов — нехватка сканеров для конечных пользователей. Наш API, легко интегрированный с Python через Java, оснащен надежными встроенными фильтрами предварительной обработки изображений, обрабатывающими повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений это обеспечивает надежное распознавание даже фотографий со смартфона. Большая часть предварительной обработки и коррекции изображений автоматизирована и требует вашего вмешательства только в сложных случаях.

Применить автоматическую коррекцию изображения — Python

api = AsposeOcr()

# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")

# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)

# recognize
result = api.recognize(input, settings)

# print result
print(res[0].recognition_text)

Универсальный конвертер Python

Наш API умело считывает любые изображения со сканеров, камер или смартфонов: документы PDF, файлы JPEG, PNG, TIFF, GIF, BMP. Полная поддержка многостраничных документов PDF, изображений TIFF и DjVu обеспечивает универсальность. Вы также можете предоставить изображение из Интернета по URL-адресу.

Результаты распознавания возвращаются в популярных форматах обмена документами и данными: обычный текст, PDF, Microsoft Word, Microsoft Excel, JSON и XML.

Распознавание PDF и сохранение результатов в различных выходных форматах — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)

Оптимизация использования ресурсов

OCR предлагает специальный алгоритм распознавания для извлечения контента из изображений с редким текстом и шумным/цветным фоном. Этот метод значительно повышает точность распознавания текста в следующих бизнес-сценариях:

  • Чтение текста с уличных фотографий.
  • Сегментируйте и идентифицируйте дорожные знаки и вывески на изображениях улиц.
  • Найдите ценники и интерпретируйте извлеченный текст как цены.
  • Находите и объединяйте интересующие вас области на этикетках продуктов питания, например информацию о пищевой ценности или списки ингредиентов.
  • Определить и проанализировать номерные знаки автомобилей.
  • Извлечение текста из меню и каталогов.

OCR на открытой местности — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")

result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)

Извлечение текста из уличных фотографий

OCR для Python предлагает специальный алгоритм распознавания, который извлекает текст из номерных знаков транспортных средств, включая темные и размытые фотографии. Полученный текст затем может быть автоматически сохранен в базе данных или автоматически проверен.

Распознать номер автомобиля — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))

# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())

# print result
print(result[0].recognition_text)