Мастерство OCR в Python: на базе Aspose.OCR для Python через .NET
OCR: преобразуйте изображения в текст с помощью Python
Другие примеры ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
> pip install aspose-ocr-python-net
Почему стоит выбрать Aspose.OCR для Python через .NET?
Отправьтесь в путешествие с Aspose.OCR для Python через .NET — универсальный и удобный API OCR. Встраивайте функции OCR в свои приложения Python с помощью менее 5 строк кода, устраняя необходимость в сложных математических вычислениях или нейронных сетях. Наш мощный механизм оптического распознавания текста обеспечивает непревзойденную скорость и точность, поддерживая 28 языков, включая латиницу, кириллицу и китайский алфавит. Будь то отсканированные изображения, фотографии со смартфона, снимки экрана или отсканированные PDF-файлы, получайте результаты в популярных форматах обмена документами и данными. Используйте фильтры предварительной обработки для обработки повернутых, перекошенных и зашумленных изображений. Оптимизируйте производительность распознавания и нагрузку на систему, переложив ресурсоемкие задачи на серверную часть .NET.
Эффективное и точное распознавание текста
Ощутите непревзойденную скорость и точность результатов оптического распознавания символов благодаря передовым технологиям Python и .NET.
Многоязычное совершенство
Легко и точно распознавайте текст на 28 языках, включая латиницу, кириллицу и китайский алфавит.
Адаптивная обработка изображений
Легко обрабатывайте изображения из различных источников — сканеров, камер и смартфонов — с помощью Python и .NET.
Владение китайскими иероглифами
Обеспечьте точное распознавание более 6000 китайских иероглифов, гарантируя точность с помощью Python и .NET.
Сохранение стилей и форматов шрифтов
Сохраняйте стили шрифтов и форматирование для точного представления текста, повышая универсальность с помощью Python и .NET.
Live code
Ощутите простоту: преобразуйте изображение в текст всего за три строки кода Python!
* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.
Преобразовать изображение в текст
Откройте для себя больше примеров ># Initialize OCR engine
recognitionEngine = AsposeOcr()
# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")
# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)
Выберите платформу
Выберите билиотеку, которая лучше всего подходит для ваших нужд.
Гибкость
Python via .NET
Универсальность
Python via Java
Скорость
Python via C++
Расширение возможностей .NET для Python на каждом углу
Aspose.OCR для Python через .NET беспрепятственно работает на любой платформе, поддерживающей .NET Framework 4.0 и более поздние версии – будь то локальный компьютер, веб-сайт сервер или облако.
Поддерживаемые форматы файлов
Aspose.OCR for Python via .NET может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.
Изображений
- JPEG
- PNG
- TIFF
- BMP
- GIF
Пакетное распознавание текста
- Multi-page PDF
- DjVu
- ZIP
- Folder
Результаты распознавания
- Text
- Microsoft Word
- Microsoft Excel
- HTML
- RTF
- ePub
- JSON
- XML
Установка для Python с серверной частью .NET
Aspose.OCR для Python через .NET поставляется в виде пакета Python с минимальными зависимостями или в виде загружаемого файла . Легко установите в свой проект, и вы будете готовы распознавать тексты на нескольких поддерживаемых языках и сохранять результаты распознавания в различных форматах.
Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.
Мощное распознавание текста для приложений Python
Наша библиотека легко интегрируется, позволяя приложениям Python беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.
28 языков распознавания
Наш API-интерфейс OCR для Python и .NET распознает множество языков и популярных письменных сценариев, включая смешанные языки:
Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.
- Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латвийский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
- Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
- Китайский: более 6000 символов;
- Хинди.
Мощные фильтры обработки
Точность и надежность оптического распознавания символов во многом зависят от качества исходного изображения. Aspose.OCR для Python через .NET предлагает большое количество полностью автоматизированных и ручных фильтров обработки изображений, которые улучшают изображение перед его отправкой в механизм OCR:
- Автоматически выпрямляет изображения, расположенные под небольшим углом к горизонтали.
- Вручную поверните сильно перекошенные изображения.
- Автоматически удаляйте грязь, пятна, царапины, блики, нежелательные градиенты и другие шумы.
- Автоматическая регулировка контрастности изображения.
- Автоматическое масштабирование или изменение размера изображения вручную.
- Преобразуйте изображения в черно-белые или в оттенках серого.
- Инвертируйте цвета изображения, чтобы светлые области выглядели темными, а темные — светлыми.
- Увеличьте толщину символов на изображении.
- Размытие шумных изображений, сохраняя края букв.
- Выпрямите кривизну страницы и исправьте искажение объектива камеры для фотографий страниц.
Оптимизирован для определенных типов документов.
Aspose.OCR для Python через .NET предлагает специально обученные нейронные сети для извлечения текста из определенных типов изображений с максимальной точностью:
Встроенная проверка орфографии.
Хотя Aspose.OCR для Python через .NET обеспечивает высокую точность распознавания, дефекты печати, грязь или нестандартные шрифты могут привести к неправильному распознаванию определенных символов или слов. Для дальнейшего улучшения результатов распознавания вы можете включить проверку орфографии, которая находит и автоматически исправляет орфографические ошибки на основе выбранного языка распознавания.
Если распознанный текст содержит специализированную терминологию, сокращения и другие слова, которых нет в общепринятых орфографических словарях, вы можете предоставить свои списки слов.
Упрощенное распознавание пакетов
Наш API-интерфейс Python OCR освобождает вас от необходимости распознавать изображения одно за другим. Используйте различные методы пакетной обработки для распознавания нескольких изображений за один вызов:
- Распознавание многостраничных файлов PDF, TIFF и DjVu.
- Распознавание всех файлов в папке.
- Распознавание всех файлов в архиве.
- Распознавание всех файлов из списка.
Обучение на примерах Python
Aspose.OCR для Python через .NET предоставляет массив примеров , написанных на Python, что позволяет вам быстро ознакомиться с его функциями. и возможности. Получите ценную информацию для создания индивидуальных решений, отвечающих потребностям вашего бизнеса на Python.
Особенности и возможности
Aspose.OCR for Python via .NET Изучите расширенные возможности Aspose.OCR для C++.
Распознавание фотографий
Извлекайте текст из фотографий смартфона с точностью до уровня сканирования.
PDF с возможностью поиска
Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.
Распознавание URL-адресов
Распознайте изображение по URL-адресу, не загружая его локально.
Массовое распознавание
Читать все изображения из многостраничных документов, папок и архивов.
Любой шрифт и стиль
Идентифицируйте и распознавайте текст во всех популярных шрифтах и стилях.
Точная настройка распознавания
Настройте каждый параметр OCR для достижения наилучших результатов распознавания.
Программа проверки орфографии
Улучшайте результаты, автоматически исправляя слова с ошибками.
Найти текст в изображениях
Поиск текста или регулярного выражения в наборе изображений.
Сравните тексты изображений
Сравнивайте тексты на двух изображениях независимо от регистра и макета.
Примеры кода Python
Изучите примеры кода, чтобы легко интегрировать Aspose.OCR для Python через .NET в ваши приложения Python.
Мастерство установки на Python
Распространяемый в виде Python Wheel или автономного загружаемого пакета, Aspose.OCR for Python через .NET легко распространяется. Интеграция в ваш проект Python непосредственно из предпочитаемой вами интегрированной среды разработки Python (IDE) — это простой процесс. Просто установите его, и вы будете готовы использовать весь спектр возможностей OCR, сохраняя результаты распознавания в различных форматах.
После установки вы можете сразу начать использовать Aspose.OCR для Python через .NET. , хотя и с некоторыми ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, которое позволит вам принять обоснованное решение о покупке Aspose.OCR для Python через .NET на более позднем этапе.
Загрузить лицензию
lic = License()
lic.set_license(self.licPath)
Распознавание текста на фотографиях
Чтение текста из любого контента в Aspose.OCR для Python через .NET так же просто, как вызов универсального метода распознавания().
Преобразование фотографии в текст — Python
api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")
# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;
# Recognize the image
results = api.recognize(input, recognitionSettings)
# Print recognition result
for result in results:
print(result.recognition_text)
Универсальный конвертер Python
Наш API умело считывает любые изображения со сканеров, камер или смартфонов: документы PDF, изображения JPEG, PNG, TIFF, GIF, BMP и даже файлы DjVu. Полная поддержка многостраничных документов PDF, изображений TIFF и DjVu обеспечивает универсальность. Вы также можете предоставить изображение из Интернета по URL-адресу.
Результаты распознавания возвращаются в популярных форматах обмена документами и данными: обычный текст, PDF, Microsoft Word, Microsoft Excel, JSON и XML.
Распознавание PDF и сохранение результатов в различных выходных форматах — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)
set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)
Оптимизация ресурсов в Python
Оптическое распознавание символов требует ресурсов. Наш API предлагает гибкие способы сбалансировать классическую триаду «время-цена-качество»:
- Выбирайте между тщательным распознаванием и быстрым распознаванием.
- Укажите количество потоков, выделяемых для распознавания, или разрешите библиотеке автоматически масштабироваться под количество ядер процессора.
- Освободите ЦП, перенеся вычисления на серверную часть .NET.
Быстрое распознавание — Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
result = api.recognize_fast(input)
Распознать одну строку
Если ваше изображение уже обрезано до одной строки текста, его можно распознать в максимально быстром режиме, без автоматических исправлений, определения структуры контента и других ресурсоемких действий. Он может ускорить распознавание текста до 7 раз быстрее, чем обычный процесс распознавания.
Распознавание одной строки текста на изображении – Python
api = AsposeOcr()
# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")
# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True
result = api.recognize(input, settings)
print(result[0].recognition_text)