Почему стоит выбрать Aspose.OCR для Python через .NET?

Отправьтесь в путешествие с Aspose.OCR для Python через .NET — универсальный и удобный API OCR. Встраивайте функции OCR в свои приложения Python с помощью менее 5 строк кода, устраняя необходимость в сложных математических вычислениях или нейронных сетях. Наш мощный механизм оптического распознавания текста обеспечивает непревзойденную скорость и точность, поддерживая 28 языков, включая латиницу, кириллицу и китайский алфавит. Будь то отсканированные изображения, фотографии со смартфона, снимки экрана или отсканированные PDF-файлы, получайте результаты в популярных форматах обмена документами и данными. Используйте фильтры предварительной обработки для обработки повернутых, перекошенных и зашумленных изображений. Оптимизируйте производительность распознавания и нагрузку на систему, переложив ресурсоемкие задачи на серверную часть .NET.

Illustration ocr

Эффективное и точное распознавание текста

Ощутите непревзойденную скорость и точность результатов оптического распознавания символов благодаря передовым технологиям Python и .NET.

Многоязычное совершенство

Легко и точно распознавайте текст на 28 языках, включая латиницу, кириллицу и китайский алфавит.

Адаптивная обработка изображений

Легко обрабатывайте изображения из различных источников — сканеров, камер и смартфонов — с помощью Python и .NET.

Владение китайскими иероглифами

Обеспечьте точное распознавание более 6000 китайских иероглифов, гарантируя точность с помощью Python и .NET.

Сохранение стилей и форматов шрифтов

Сохраняйте стили шрифтов и форматирование для точного представления текста, повышая универсальность с помощью Python и .NET.

Live code

Ощутите простоту: преобразуйте изображение в текст всего за три строки кода Python!

Извлечь текст Извлечь текст Перетащите файл сюда или нажмите, чтобы просмотреть *

* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.

Результат распознавания
 

Преобразовать изображение в текст

Откройте для себя больше примеров >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Выберите платформу

Выберите билиотеку, которая лучше всего подходит для ваших нужд.

Гибкость

Python via .NET

Удобная разработка и легко читаемый код
Самый широкий функционал
Может быть немного медленней, чем другие библиотеки

Универсальность

Python via Java

Используйте единую библиотеку на любой платформе
Запускайте ваше приложение на любом устройстве
Требуется Java Runtime Environment (JRE) 8 или новее

Скорость

Python via C++

Гарантированная скрость на любой платформе
Гибкое управление ресурсами и производительностью
Ориентировано на опытных разработчиков

Расширение возможностей .NET для Python на каждом углу

Aspose.OCR для Python через .NET беспрепятственно работает на любой платформе, поддерживающей .NET Framework 4.0 и более поздние версии – будь то локальный компьютер, веб-сайт сервер или облако.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Поддерживаемые форматы файлов

Aspose.OCR for Python via .NET может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.

Изображений

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Пакетное распознавание текста

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Результаты распознавания

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Установка для Python с серверной частью .NET

Aspose.OCR для Python через .NET поставляется в виде пакета Python с минимальными зависимостями или в виде загружаемого файла . Легко установите в свой проект, и вы будете готовы распознавать тексты на нескольких поддерживаемых языках и сохранять результаты распознавания в различных форматах.

Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.

Мощное распознавание текста для приложений Python

Наша библиотека легко интегрируется, позволяя приложениям Python беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.

28 языков распознавания

Наш API-интерфейс OCR для Python и .NET распознает множество языков и популярных письменных сценариев, включая смешанные языки:

Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.

  • Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латвийский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
  • Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
  • Китайский: более 6000 символов;
  • Хинди.

Мощные фильтры обработки

Точность и надежность оптического распознавания символов во многом зависят от качества исходного изображения. Aspose.OCR для Python через .NET предлагает большое количество полностью автоматизированных и ручных фильтров обработки изображений, которые улучшают изображение перед его отправкой в ​​механизм OCR:

  • Автоматически выпрямляет изображения, расположенные под небольшим углом к ​​горизонтали.
  • Вручную поверните сильно перекошенные изображения.
  • Автоматически удаляйте грязь, пятна, царапины, блики, нежелательные градиенты и другие шумы.
  • Автоматическая регулировка контрастности изображения.
  • Автоматическое масштабирование или изменение размера изображения вручную.
  • Преобразуйте изображения в черно-белые или в оттенках серого.
  • Инвертируйте цвета изображения, чтобы светлые области выглядели темными, а темные — светлыми.
  • Увеличьте толщину символов на изображении.
  • Размытие шумных изображений, сохраняя края букв.
  • Выпрямите кривизну страницы и исправьте искажение объектива камеры для фотографий страниц.

Оптимизирован для определенных типов документов.

Aspose.OCR для Python через .NET предлагает специально обученные нейронные сети для извлечения текста из определенных типов изображений с максимальной точностью:

Встроенная проверка орфографии.

Хотя Aspose.OCR для Python через .NET обеспечивает высокую точность распознавания, дефекты печати, грязь или нестандартные шрифты могут привести к неправильному распознаванию определенных символов или слов. Для дальнейшего улучшения результатов распознавания вы можете включить проверку орфографии, которая находит и автоматически исправляет орфографические ошибки на основе выбранного языка распознавания.

Если распознанный текст содержит специализированную терминологию, сокращения и другие слова, которых нет в общепринятых орфографических словарях, вы можете предоставить свои списки слов.

Упрощенное распознавание пакетов

Наш API-интерфейс Python OCR освобождает вас от необходимости распознавать изображения одно за другим. Используйте различные методы пакетной обработки для распознавания нескольких изображений за один вызов:

  • Распознавание многостраничных файлов PDF, TIFF и DjVu.
  • Распознавание всех файлов в папке.
  • Распознавание всех файлов в архиве.
  • Распознавание всех файлов из списка.

Обучение на примерах Python

Aspose.OCR для Python через .NET предоставляет массив примеров , написанных на Python, что позволяет вам быстро ознакомиться с его функциями. и возможности. Получите ценную информацию для создания индивидуальных решений, отвечающих потребностям вашего бизнеса на Python.

Особенности и возможности

Aspose.OCR for Python via .NET Изучите расширенные возможности Aspose.OCR для C++.

Feature icon

Распознавание фотографий

Извлекайте текст из фотографий смартфона с точностью до уровня сканирования.

Feature icon

PDF с возможностью поиска

Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.

Feature icon

Распознавание URL-адресов

Распознайте изображение по URL-адресу, не загружая его локально.

Feature icon

Массовое распознавание

Читать все изображения из многостраничных документов, папок и архивов.

Feature icon

Любой шрифт и стиль

Идентифицируйте и распознавайте текст во всех популярных шрифтах и ​​стилях.

Feature icon

Точная настройка распознавания

Настройте каждый параметр OCR для достижения наилучших результатов распознавания.

Feature icon

Программа проверки орфографии

Улучшайте результаты, автоматически исправляя слова с ошибками.

Feature icon

Найти текст в изображениях

Поиск текста или регулярного выражения в наборе изображений.

Feature icon

Сравните тексты изображений

Сравнивайте тексты на двух изображениях независимо от регистра и макета.

Примеры кода Python

Изучите примеры кода, чтобы легко интегрировать Aspose.OCR для Python через .NET в ваши приложения Python.

Мастерство установки на Python

Распространяемый в виде Python Wheel или автономного загружаемого пакета, Aspose.OCR for Python через .NET легко распространяется. Интеграция в ваш проект Python непосредственно из предпочитаемой вами интегрированной среды разработки Python (IDE) — это простой процесс. Просто установите его, и вы будете готовы использовать весь спектр возможностей OCR, сохраняя результаты распознавания в различных форматах.

После установки вы можете сразу начать использовать Aspose.OCR для Python через .NET. , хотя и с некоторыми ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, которое позволит вам принять обоснованное решение о покупке Aspose.OCR для Python через .NET на более позднем этапе.

Загрузить лицензию

lic = License()
lic.set_license(self.licPath)

Распознавание текста на фотографиях

Чтение текста из любого контента в Aspose.OCR для Python через .NET так же просто, как вызов универсального метода распознавания().

Преобразование фотографии в текст — Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Универсальный конвертер Python

Наш API умело считывает любые изображения со сканеров, камер или смартфонов: документы PDF, изображения JPEG, PNG, TIFF, GIF, BMP и даже файлы DjVu. Полная поддержка многостраничных документов PDF, изображений TIFF и DjVu обеспечивает универсальность. Вы также можете предоставить изображение из Интернета по URL-адресу.

Результаты распознавания возвращаются в популярных форматах обмена документами и данными: обычный текст, PDF, Microsoft Word, Microsoft Excel, JSON и XML.

Распознавание PDF и сохранение результатов в различных выходных форматах — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Оптимизация ресурсов в Python

Оптическое распознавание символов требует ресурсов. Наш API предлагает гибкие способы сбалансировать классическую триаду «время-цена-качество»:

  • Выбирайте между тщательным распознаванием и быстрым распознаванием.
  • Укажите количество потоков, выделяемых для распознавания, или разрешите библиотеке автоматически масштабироваться под количество ядер процессора.
  • Освободите ЦП, перенеся вычисления на серверную часть .NET.

Быстрое распознавание — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Распознать одну строку

Если ваше изображение уже обрезано до одной строки текста, его можно распознать в максимально быстром режиме, без автоматических исправлений, определения структуры контента и других ресурсоемких действий. Он может ускорить распознавание текста до 7 раз быстрее, чем обычный процесс распознавания.

Распознавание одной строки текста на изображении – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)