Мастерство преобразования изображений в текст с помощью Python через Java
Распознавание текста в изображениях с помощью Python
Другие примеры ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-java or
download
Почему Aspose.OCR для Python через Java?
Aspose.OCR для Python через Java легко интегрирует мощные возможности оптического распознавания символов (OCR) в ваши кроссплатформенные ноутбуки и приложения Python. Благодаря нашему интуитивно понятному и высокоскоростному API вы можете легко извлекать текст из сканированных изображений, снимков экрана, веб-ссылок или фотографий со смартфона, получая результаты, готовые для консолидации, анализа или хранения. Распознавайте отсканированные изображения, фотографии со смартфона, снимки экрана и отсканированные PDF-файлы, сохраняя результаты в популярных форматах документов. Расширенные фильтры предварительной обработки обрабатывают повернутые, перекошенные и зашумленные изображения. Оптимизируйте производительность, переложив задачи на графический процессор.
Быстрое и точное распознавание текста
Достигайте высокоскоростных и точных результатов оптического распознавания символов с помощью нашей передовой технологии Python через Java.
Многоязычная поддержка
Распознавайте текст на 28 языках, включая латиницу, кириллицу и китайскую письменность, обеспечивая универсальность для ваших приложений Python через Java.
Гибкая поддержка изображений
Легко обрабатывайте изображения со сканеров, камер и смартфонов с помощью Python через Java.
Точность распознавания китайских символов
Точно распознавайте более 6000 китайских иероглифов в своих проектах Python с помощью Java.
Сохранение стилей шрифтов и форматирования
Сохраняйте стили шрифтов и форматирование для точного представления распознанного текста в ваших приложениях Python через Java.
Live code
Запустите распознавание текста на изображениях всего за три строки кода. Почувствуйте простоту!
* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.
Преобразовать изображение в текст
Больше примеров ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Выберите платформу
Выберите билиотеку, которая лучше всего подходит для ваших нужд.
Гибкость
Python via .NET
Универсальность
Python via Java
Скорость
Python via C++
Совместимость с серверной частью Java
Наша библиотека, разработанная как модуль Python, обеспечивает совместимость с основными операционными системами, поддерживающими Java , включая Microsoft Windows, Linux и macOS или облачные платформы. Это позволяет разрабатывать приложения на одной платформе и беспрепятственно запускать их на другой, устраняя необходимость каких-либо модификаций кода.
Поддерживаемые форматы файлов
Aspose.OCR for Python via Java может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.
Изображений
- JPEG
- PNG
- TIFF
- GIF
- Bitmap
Пакетное распознавание текста
- Multi-page PDF
- ZIP
- Folder
Результаты распознавания
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Простая установка Python через Java
Aspose.OCR для Python через Java поставляется в виде пакета Python или загружаемого файла с минимальными зависимостями. Легко установите в свой проект, и вы будете готовы распознавать тексты на нескольких поддерживаемых языках и сохранять результаты распознавания в различных форматах.
Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.
Мощное распознавание текста для приложений Python
Наша библиотека легко интегрируется, позволяя приложениям Python беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.
28 языков распознавания
Наш API OCR для Python и Java распознает множество языков и популярных письменных сценариев, включая смешанные языки:
Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.
- Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латвийский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
- Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
- Китайский: более 6000 символов;
- Хинди.
Расширенные фильтры обработки изображений
Точность оптического распознавания символов во многом зависит от качества исходного изображения. Aspose.OCR для Python через Java предлагает широкий набор фильтров автоматической и ручной обработки изображений для оптимизации изображения перед отправкой в механизм OCR:
- Автоматически выпрямляет слегка наклоненные изображения.
- Вручную исправьте поворот сильно перекошенных изображений.
- Автоматически удаляйте грязь, пятна, царапины, блики, нежелательные градиенты и другие типы шума.
- Автоматическая регулировка контрастности изображения.
- Автоматически увеличивайте масштаб или изменяйте размер изображения вручную.
- Преобразуйте изображения в черно-белые или в оттенках серого.
- Инвертируйте цвета изображения, делая светлые области темными, а темные — светлыми.
- Увеличьте толщину символов на изображении.
- Размытие шумных изображений, сохраняя края букв.
- Выпрямите перекос страницы и исправьте искажение объектива камеры на фотографиях страниц.
Специализированные API для различных типов документов.
Aspose.OCR for Python через Java предлагает специально обученные нейронные сети для извлечения текста из определенных типов изображений с максимальной точностью:
- Отсканированные или сфотографированные удостоверения личности и паспорта.
- Номерные знаки транспортных средств.
- Счета-фактуры.
- Квитанции.
Встроенная проверка орфографии.
Хотя Aspose.OCR for Python через Java обеспечивает высокую точность распознавания, дефекты печати, грязь или нестандартные шрифты могут привести к неправильному распознаванию определенных символов или слов. Для дальнейшего улучшения результатов распознавания вы можете включить проверку орфографии, которая находит и автоматически исправляет орфографические ошибки на основе выбранного языка распознавания.
Если распознанный текст содержит специализированную терминологию, сокращения и другие слова, которых нет в общепринятых орфографических словарях, вы можете предоставить свои списки слов.
Эффективное распознавание партий
Наш API-интерфейс Python OCR позволяет упростить распознавание изображений. Используйте универсальные методы пакетной обработки для эффективной обработки нескольких изображений за один вызов:
- Распознавание многостраничных файлов PDF, TIFF.
- Обработать все файлы в папке.
- Обработка распознавания всех файлов в архиве.
- Распознавать изображения из указанного списка.
Обучение с помощью примеров Python
Изучите множество примеров Python , которые помогут вам быстро освоить функции и возможности нашего решения OCR. Быстро получите представление о создании индивидуальных решений, отвечающих конкретным бизнес-требованиям.
Особенности и возможности
Aspose.OCR for Python via Java Изучите расширенные возможности Aspose.OCR для Python
Распознавание фотографий
Извлекайте текст из фотографий смартфона с точностью до уровня сканирования.
PDF с возможностью поиска
Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.
Распознавание URL-адресов
Распознайте изображение по URL-адресу, не загружая его локально.
Массовое распознавание
Читать все изображения из многостраничных документов, папок и архивов.
Любой шрифт и стиль
Идентифицируйте и распознавайте текст во всех популярных шрифтах и стилях.
Точная настройка распознавания
Настройте каждый параметр OCR для достижения наилучших результатов распознавания.
Программа проверки орфографии
Улучшайте результаты, автоматически исправляя слова с ошибками.
Найти текст в изображениях
Поиск текста или регулярного выражения в наборе изображений.
Сравните тексты изображений
Сравнивайте тексты на двух изображениях независимо от регистра и макета.
Примеры кода Python
Откройте для себя примеры кода, позволяющие легко интегрировать Aspose.OCR для Python через Java в ваши приложения.
Простая установка
Aspose.OCR for Python через Java в виде пакета Python или загружаемого файла с минимальными зависимостями обеспечивает легкое распространение. Интегрируйте его в свой проект непосредственно из Python, и вы будете готовы использовать все возможности OCR, сохраняя результаты распознавания в различных форматах.
После установки сразу же начните использовать Aspose.OCR для Python через Java, хотя и с определенными ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, которое позволит вам позже принять обоснованное решение о покупке Aspose.OCR для Python через Java.
Загрузить лицензию
lic = License()
lic.set_license(self.licPath)
Распознавание изображений
Основная проблема приложений оптического распознавания символов — нехватка сканеров для конечных пользователей. Наш API, легко интегрированный с Python через Java, оснащен надежными встроенными фильтрами предварительной обработки изображений, обрабатывающими повернутые, перекошенные и зашумленные изображения. В сочетании с поддержкой всех форматов изображений это обеспечивает надежное распознавание даже фотографий со смартфона. Большая часть предварительной обработки и коррекции изображений автоматизирована и требует вашего вмешательства только в сложных случаях.
Применить автоматическую коррекцию изображения — Python
api = AsposeOcr()
# set preprocessing options
filters = PreprocessingFilter()
filters.add(PreprocessingFilter.auto_skew())
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE, filters)
input.add("sample.png")
# set recognition options
settings = RecognitionSettings()
settings.set_detect_areas_mode(DetectAreasMode.TABLE)
settings.set_threads_count(1)
settings.set_language(Language.ENG)
# recognize
result = api.recognize(input, settings)
# print result
print(res[0].recognition_text)
Универсальный конвертер Python
Наш API умело считывает любые изображения со сканеров, камер или смартфонов: документы PDF, файлы JPEG, PNG, TIFF, GIF, BMP. Полная поддержка многостраничных документов PDF, изображений TIFF и DjVu обеспечивает универсальность. Вы также можете предоставить изображение из Интернета по URL-адресу.
Результаты распознавания возвращаются в популярных форматах обмена документами и данными: обычный текст, PDF, Microsoft Word, Microsoft Excel, JSON и XML.
Распознавание PDF и сохранение результатов в различных выходных форматах — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode(DetectAreasMode.NONE)
result = api.recognize(input, set)
api.save_multipage_document("test.xml", Format.XML, result)
api.save_multipage_document("test.json", Format.JSON, result)
api.save_multipage_document("test.pdf", Format.PDF, result)
api.save_multipage_document("test.xlsx", Format.XLSX, result)
api.save_multipage_document("test.docx", Format.DOCX, result)
api.save_multipage_document("test.txt", Format.TEXT, result)
api.save_multipage_document("test.html", Format.HTML, result)
api.save_multipage_document("test.epub", Format.EPUB, result)
api.save_multipage_document("test.rtf", Format.RTF, result)
Оптимизация использования ресурсов
OCR предлагает специальный алгоритм распознавания для извлечения контента из изображений с редким текстом и шумным/цветным фоном. Этот метод значительно повышает точность распознавания текста в следующих бизнес-сценариях:
- Чтение текста с уличных фотографий.
- Сегментируйте и идентифицируйте дорожные знаки и вывески на изображениях улиц.
- Найдите ценники и интерпретируйте извлеченный текст как цены.
- Находите и объединяйте интересующие вас области на этикетках продуктов питания, например информацию о пищевой ценности или списки ингредиентов.
- Определить и проанализировать номерные знаки автомобилей.
- Извлечение текста из меню и каталогов.
OCR на открытой местности — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("border.jpg")
result = api.recognize(input, RecognitionSettings())
result_street = api.recognize_street_photo(input)
print(result[0].recognition_text)
Извлечение текста из уличных фотографий
OCR для Python предлагает специальный алгоритм распознавания, который извлекает текст из номерных знаков транспортных средств, включая темные и размытые фотографии. Полученный текст затем может быть автоматически сохранен в базе данных или автоматически проверен.
Распознать номер автомобиля — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add(os.path.join(self.dataDir, "CarNumbers.jfif"))
# recognize
result = api.recognize_car_plate(input, CarPlateRecognitionSettings())
# print result
print(result[0].recognition_text)