Почему стоит выбрать Aspose.OCR для Python через .NET?

Отправьтесь в путешествие с Aspose.OCR для Python через .NET — универсальный и удобный API OCR. Встраивайте функции OCR в свои приложения Python с помощью менее 5 строк кода, устраняя необходимость в сложных математических вычислениях или нейронных сетях. Наш мощный механизм оптического распознавания текста обеспечивает непревзойденную скорость и точность, поддерживая 28 языков, включая латиницу, кириллицу и китайский алфавит. Будь то отсканированные изображения, фотографии со смартфона, снимки экрана или отсканированные PDF-файлы, получайте результаты в популярных форматах обмена документами и данными. Используйте фильтры предварительной обработки для обработки повернутых, перекошенных и зашумленных изображений. Оптимизируйте производительность распознавания и нагрузку на систему, переложив ресурсоемкие задачи на серверную часть .NET.

Illustration ocr

Эффективное и точное распознавание текста

Оцените непревзойденную скорость и точность результатов оптического распознавания символов благодаря передовым технологиям Python и .NET.

Многоязычное совершенство

Распознавайте текст на 28 языках, включая латиницу, кириллицу и китайский алфавит, с легкостью и точностью.

Адаптивная обработка изображений

Легко обрабатывайте изображения из различных источников — сканеров, камер и смартфонов — с помощью Python и .NET.

Владение китайскими иероглифами

Обеспечьте точное распознавание более 6000 китайских иероглифов, гарантируя точность с помощью Python и .NET.

Сохранение стилей и форматов шрифтов

Сохраняйте стили шрифтов и форматирование для точного представления текста, повышая универсальность с помощью Python и .NET.

Пример живого кода

Ощутите простоту: преобразуйте изображение в текст всего за три строки кода Python!

Готов признать Готов признать Перетащите файл сюда или нажмите, чтобы просмотреть *

* Загружая свои файлы или используя услугу, вы соглашаетесь с нашими Условия эксплуатации и политика конфиденциальности.

Результат распознавания
 

Преобразовать изображение в текст

Откройте для себя больше примеров >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Расширение возможностей .NET для Python на каждом углу

Aspose.OCR для Python через .NET беспрепятственно работает на любой платформе, поддерживающей .NET Framework 4.0 и более поздние версии – будь то локальный компьютер, веб-сайт сервер или облако.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Поддерживаемые форматы файлов

Aspose.OCR for Python via .NET может работать практически с любым файлом можно получить со сканера или камеры. Результаты распознавания возвращаются в наиболее популярных форматах обмена файлами и данными, которые можно сохранить, импортировать в базу данных или проанализировать в режиме реального времени.

Изображений

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Пакетное распознавание текста

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Результаты распознавания

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Установка для Python с серверной частью .NET

Aspose.OCR для Python через .NET поставляется в виде пакета Python с минимальными зависимостями или в виде загружаемого файла . Легко установите в свой проект, и вы будете готовы распознавать тексты на нескольких поддерживаемых языках и сохранять результаты распознавания в различных форматах.

Запросите пробную лицензию , чтобы начать разработку полнофункционального приложения OCR без ограничений.

Мощное распознавание текста для приложений Python

Наша библиотека легко интегрируется, позволяя приложениям Python беспрепятственно работать на любой платформе — настольной Windows, Windows Server, macOS, Linux и в облаке.

28 языков распознавания

Наш API-интерфейс OCR для Python и .NET распознает множество языков и популярных письменных сценариев, включая смешанные языки:

Оставьте определение языка библиотеке или определите язык самостоятельно, чтобы повысить производительность и надежность распознавания.

  • Расширенный латинский алфавит: хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, немецкий, итальянский, латышский, литовский, норвежский, польский, португальский, румынский, словацкий, словенский, испанский, шведский;
  • Кириллица: белорусский, болгарский, казахский, русский, сербский, украинский;
  • Китайский: более 6000 символов;
  • Хинди.

Мощные фильтры обработки

Точность и надежность оптического распознавания символов во многом зависят от качества исходного изображения. Aspose.OCR для Python через .NET предлагает большое количество полностью автоматизированных и ручных фильтров обработки изображений, которые улучшают изображение перед его отправкой в ​​механизм OCR:

  • Автоматически выпрямляет изображения, расположенные под небольшим углом к ​​горизонтали.
  • Вручную поверните сильно перекошенные изображения.
  • Автоматически удаляйте грязь, пятна, царапины, блики, нежелательные градиенты и другие шумы.
  • Автоматическая регулировка контрастности изображения.
  • Автоматически увеличивайте масштаб или изменяйте размер изображения вручную.
  • Преобразуйте изображения в черно-белые или в оттенках серого.
  • Инвертируйте цвета изображения, чтобы светлые области выглядели темными, а темные — светлыми.
  • Увеличьте толщину символов на изображении.
  • Размытие шумных изображений, сохраняя края букв.
  • Выпрямите кривизну страницы и исправьте искажение объектива камеры для фотографий страниц.

Оптимизирован для определенных типов документов.

Aspose.OCR для Python через .NET предлагает специально обученные нейронные сети для извлечения текста из определенных типов изображений с максимальной точностью:

Встроенная проверка орфографии.

Хотя Aspose.OCR для Python через .NET обеспечивает высокую точность распознавания, дефекты печати, грязь или нестандартные шрифты могут привести к неправильному распознаванию определенных символов или слов. Для дальнейшего улучшения результатов распознавания вы можете включить проверку орфографии, которая находит и автоматически исправляет орфографические ошибки на основе выбранного языка распознавания.

Если распознанный текст содержит специализированную терминологию, сокращения и другие слова, которых нет в общепринятых орфографических словарях, вы можете предоставить свои списки слов.

Упрощенное распознавание пакетов

Наш API-интерфейс Python OCR освобождает вас от необходимости распознавать изображения одно за другим. Используйте различные методы пакетной обработки для распознавания нескольких изображений за один вызов:

  • Распознавание многостраничных файлов PDF, TIFF и DjVu.
  • Распознавание всех файлов в папке.
  • Распознавание всех файлов в архиве.
  • Распознавание всех файлов из списка.

Обучение на примерах Python

Aspose.OCR для Python через .NET предоставляет массив примеров , написанных на Python, что позволяет вам быстро ознакомиться с его функциями. и возможности. Получите ценную информацию для создания индивидуальных решений, отвечающих потребностям вашего бизнеса на Python.

Особенности и возможности

Aspose.OCR for Python via .NET Изучите расширенные возможности Aspose.OCR для C++.

Feature icon

Распознавание фотографий

Извлекайте текст из фотографий смартфона с точностью на уровне сканирования.

Feature icon

PDF с возможностью поиска

Преобразуйте любое отсканированное изображение в полностью доступный для поиска и индексируемый документ.

Feature icon

Распознавание URL-адресов

Распознайте изображение по URL-адресу, не загружая его локально.

Feature icon

Массовое распознавание

Читать все изображения из многостраничных документов, папок и архивов.

Feature icon

Любой шрифт и стиль

Идентифицируйте и распознавайте текст во всех популярных шрифтах и ​​стилях.

Feature icon

Точная настройка распознавания

Настройте каждый параметр OCR для достижения наилучших результатов распознавания.

Feature icon

Программа проверки орфографии

Улучшайте результаты, автоматически исправляя слова с ошибками.

Feature icon

Найти текст в изображениях

Поиск текста или регулярного выражения в наборе изображений.

Feature icon

Сравните тексты изображений

Сравнивайте тексты на двух изображениях независимо от регистра и макета.

Примеры кода Python

Изучите примеры кода, чтобы легко интегрировать Aspose.OCR для Python через .NET в ваши приложения Python.

Мастерство установки на Python

Распространяемый в виде Python Wheel или автономного загружаемого пакета, Aspose.OCR для Python через .NET легко распространяется. Интеграция в ваш проект Python непосредственно из предпочитаемой вами интегрированной среды разработки Python (IDE) — это простой процесс. Просто установите его, и вы будете готовы использовать весь спектр возможностей OCR, сохраняя результаты распознавания в различных форматах.

После установки вы можете сразу начать использовать Aspose.OCR для Python через .NET. , хотя и с некоторыми ограничениями. Временная лицензия снимает все ограничения пробной версии на 30 дней. Используйте этот период, чтобы начать разработку полнофункционального приложения OCR, которое позволит вам принять обоснованное решение о покупке Aspose.OCR для Python через .NET на более позднем этапе.

Загрузить лицензию

lic = License()
lic.set_license(self.licPath)

Распознавание текста на фотографиях

Чтение текста из любого контента в Aspose.OCR для Python через .NET так же просто, как вызов универсального метода распознавания().

Преобразование фотографии в текст — Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Универсальный конвертер Python

Наш API умело считывает любые изображения со сканеров, камер или смартфонов: документы PDF, изображения JPEG, PNG, TIFF, GIF, BMP и даже файлы DjVu. Полная поддержка многостраничных документов PDF, изображений TIFF и DjVu обеспечивает универсальность. Вы также можете предоставить изображение из Интернета по URL-адресу.

Результаты распознавания возвращаются в популярных форматах обмена документами и данными: обычный текст, PDF, Microsoft Word, Microsoft Excel, JSON и XML.

Распознавание PDF и сохранение результатов в различных выходных форматах — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Оптимизация ресурсов в Python

Оптическое распознавание символов требует ресурсов. Наш API предлагает гибкие способы сбалансировать классическую триаду «время-цена-качество»:

  • Выбирайте между тщательным распознаванием и быстрым распознаванием.
  • Укажите количество потоков, выделяемых для распознавания, или разрешите библиотеке автоматически масштабироваться под количество ядер процессора.
  • Освободите ЦП, перенеся вычисления на серверную часть .NET.

Быстрое распознавание — Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Распознать одну строку

Если ваше изображение уже обрезано до одной строки текста, его можно распознать в максимально быстром режиме, без автоматических исправлений, определения структуры контента и других ресурсоемких действий. Он может ускорить распознавание текста до 7 раз быстрее, чем обычный процесс распознавания.

Распознавание одной строки текста на изображении – Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)