Чому варто вибрати Aspose.OCR для Python через .NET?

Вирушайте в подорож з Aspose.OCR для Python через .NET – універсальним і зручним OCR API. Вбудуйте функції оптичного розпізнавання символів у свої програми Python за допомогою менше ніж 5 рядків коду, усуваючи потребу у складних математичних чи нейронних мережах. Наш потужний механізм OCR забезпечує неперевершену швидкість і точність, підтримуючи 28 мов, у тому числі латиницю, кирилицю та китайську. Будь то відскановані зображення, фотографії зі смартфона, знімки екрана чи відскановані PDF-файли, отримуйте результати в популярних форматах обміну документами та даними. Використовуйте фільтри попередньої обробки для обробки повернутих, перекошених і зашумлених зображень. Оптимізуйте продуктивність розпізнавання та навантаження на систему, переклавши ресурсомісткі завдання на серверну частину .NET.

Illustration ocr

Ефективне та точне володіння OCR

Відчуйте неперевершену швидкість і точність результатів оптичного розпізнавання символів завдяки передовій технології Python і .NET.

Багатомовна досконалість

Легко й точно розпізнавайте текст 28 мовами, включно з латиницею, кирилицею та китайською.

Адаптивна обробка зображень

Легко обробляйте зображення з різних джерел – сканерів, камер і смартфонів – за допомогою Python і .NET.

Володіння китайськими ієрогліфами

Досягніть точного розпізнавання понад 6000 китайських ієрогліфів, забезпечуючи точність за допомогою Python і .NET.

Збереження стилів і форматів шрифтів

Підтримуйте стилі шрифтів і форматування для точного представлення тексту, підвищуючи універсальність за допомогою Python і .NET.

Приклад живого коду

Відчуйте простоту: перетворіть зображення на текст лише за три рядки коду Python!

Готовий розпізнати Готовий розпізнати Перетягніть файл сюди або натисніть, щоб переглянути *

* Завантажуючи свої файли або користуючись сервісом, ви погоджуєтеся з нашими Умови використання і Політика конфіденційності.

Результат розпізнавання
 

Перетворення зображення на текст

Дізнайтеся більше прикладів >
# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Виберіть платформу

Виберіть бібліотеку, яка найкраще підходить для ваших потреб.

Гнучкість

Python via .NET

Зручна розробка та легкочитаний код
Найширший функціонал
Може бути трохи повільнішою, ніж інші бібліотеки

Універсальність

Python via Java

Використовуйте єдину бібліотеку на будь-якій платформі
Запускайте ваш додаток на будь-якому пристрої
Потрібне Java Runtime Environment (JRE) 8 або новіше

Швидкість

Python via C++

Гарантована швидкість на будь-якій платформі
Гнучке управління ресурсами та продуктивністю
Орієнтовано на досвідчених розробників

Розширення можливостей .NET для Python у кожному кутку

Aspose.OCR для Python через .NET бездоганно працює на будь-якій платформі, що підтримує .NET Framework 4.0 і пізніших версій – будь то локальна машина, веб сервер або хмара.

Microsoft Windows
Linux
MacOS
GitHub
Microsoft Azure
Amazon Web Services
Docker

Підтримувані формати файлів

Aspose.OCR for Python via .NET може працювати практично з будь-яким файлом можна отримати зі сканера або камери. Результати розпізнавання повертаються в найпопулярніших форматах обміну файлами та даними, які можна зберігати, імпортувати до бази даних або аналізувати в реальному часі.

Зображення

  • JPEG
  • PNG
  • TIFF
  • BMP
  • GIF

Пакетне OCR

  • Multi-page PDF
  • DjVu
  • ZIP
  • Folder

Результати розпізнавання

  • Text
  • PDF
  • Microsoft Word
  • Microsoft Excel
  • HTML
  • RTF
  • ePub
  • JSON
  • XML

Інсталяція для Python із серверною частиною .NET

Aspose.OCR для Python через .NET поставляється як пакет Python із мінімальними залежностями або як файл для завантаження . Легко встановіть його у свій проект, і ви готові розпізнавати тексти кількома підтримуваними мовами та зберігати результати розпізнавання в різних форматах.

Подайте запит на пробну ліцензію , щоб розпочати розробку повнофункціональної програми OCR без обмежень.

Потужне OCR для програм Python

Наша бібліотека легко інтегрується, дозволяючи програмам Python безперебійно працювати на будь-якій платформі – Windows, Windows Server, macOS, Linux і хмарі.

28 Мови розпізнавання

Наш API OCR для Python і .NET розпізнає безліч мов і популярних сценаріїв написання, включаючи змішані мови:

Залиште визначення мови бібліотеці або визначте мову самостійно для підвищення продуктивності та надійності розпізнавання.

  • Розширена латиниця: хорватська, чеська, датська, голландська, англійська, естонська, фінська, французька, німецька, італійська, латвійська, литовська, норвезька, польська, португальська, румунська, словацька, словенська, іспанська, шведська;
  • кирилиця: білоруська, болгарська, казахська, російська, сербська, українська;
  • китайська: понад 6000 символів;
  • Хінді.

Потужні фільтри обробки

Точність і надійність оптичного розпізнавання символів сильно залежить від якості вихідного зображення. Aspose.OCR для Python через .NET пропонує велику кількість повністю автоматизованих і ручних фільтрів обробки зображень, які покращують зображення перед його надсиланням до механізму OCR:

  • Автоматично вирівнюйте зображення, вирівняні під невеликим кутом до горизонталі.
  • Повертайте вручну сильно спотворені зображення.
  • Автоматично видаляйте бруд, плями, подряпини, відблиски, небажані градієнти та інші шуми.
  • Автоматичне налаштування контрастності зображення.
  • Автоматично збільшити або вручну змінити розмір зображення.
  • Перетворення зображень на чорно-біле або в градаціях сірого.
  • Інвертуйте кольори зображення так, щоб світлі ділянки виглядали темними, а темні — світлими.
  • Збільште товщину символів на зображенні.
  • Розмити шумні зображення, зберігаючи краї літер.
  • Вирівняйте кривизну сторінки та виправте спотворення об’єктива камери для фотографій на сторінці.

Оптимізовано для певних типів документів

Aspose.OCR для Python через .NET пропонує спеціально навчені нейронні мережі для вилучення тексту з певних типів зображень із максимальною точністю:

Вбудована перевірка орфографії

Хоча Aspose.OCR для Python через .NET забезпечує високу точність розпізнавання, дефекти друку, бруд або нестандартні шрифти можуть призвести до неправильного розпізнавання певних символів або слів. Щоб ще більше покращити результати розпізнавання, ви можете ввімкнути перевірку орфографії, яка знаходить і автоматично виправляє орфографічні помилки на основі вибраної мови розпізнавання.

Якщо розпізнаний текст містить спеціальну термінологію, абревіатури та інші слова, яких немає в загальноприйнятих орфографічних словниках, ви можете надати власні списки слів.

Спрощене розпізнавання пакетів

Наш API OCR Python звільняє вас від розпізнавання зображень одне за одним. Використовуйте різні методи пакетної обробки для розпізнавання кількох зображень за один виклик:

  • Розпізнавання багатосторінкових файлів PDF, TIFF і DjVu.
  • Розпізнавання всіх файлів у папці.
  • Розпізнавання всіх файлів в архіві.
  • Розпізнавання всіх файлів зі списку.

Навчання на прикладах Python

Aspose.OCR для Python через .NET надає масив прикладів , написаних на Python, що дозволяє швидко ознайомитися з його функціями і можливості. Отримайте знання для створення індивідуальних рішень для задоволення потреб вашого бізнесу на Python.

Особливості та можливості

Aspose.OCR for Python via .NET Ознайомтеся з розширеними можливостями Aspose.OCR для C++.

Feature icon

Фото OCR

Витягуйте текст із фотографій смартфона з точністю сканування.

Feature icon

PDF з можливістю пошуку

Перетворюйте будь-яке скановане зображення на документ із можливістю пошуку та індексування.

Feature icon

розпізнавання URL

Розпізнайте зображення за URL-адресою, не завантажуючи його локально.

Feature icon

Масове розпізнавання

Читайте всі зображення з багатосторінкових документів, папок і архівів.

Feature icon

Будь-який шрифт і стиль

Визначайте та розпізнавайте текст усіх популярних шрифтів і стилів.

Feature icon

Точне налаштування розпізнавання

Налаштуйте кожен параметр OCR для найкращих результатів розпізнавання.

Feature icon

Перевірка орфографії

Покращуйте результати, автоматично виправляючи слова з помилками.

Feature icon

Знайдіть текст на малюнках

Шукайте текст або регулярний вираз у наборі зображень.

Feature icon

Порівняйте тексти зображень

Порівняйте тексти на двох зображеннях, незалежно від регістру та компонування.

Зразки коду Python

Ознайомтеся зі зразками коду, щоб легко інтегрувати Aspose.OCR для Python через .NET у ваші програми Python.

Майстерність встановлення на Python

Aspose.OCR для Python через .NET легко розповсюджується як Python Wheel або автономний пакет для завантаження. Інтеграція у ваш проект Python безпосередньо з інтегрованого середовища розробки Python (IDE) є безперебійним процесом. Просто встановіть його, і ви готові використовувати повний спектр можливостей OCR, зберігаючи результати розпізнавання в різних форматах.

Після встановлення ви можете негайно почати використовувати Aspose.OCR для Python через .NET , хоча й з певними обмеженнями. Тимчасова ліцензія скасовує всі обмеження пробної версії на 30 днів. Використайте цей період, щоб розпочати розробку повнофункціональної програми OCR, яка дозволить вам прийняти обґрунтоване рішення щодо придбання Aspose.OCR для Python через .NET на пізнішому етапі.

Ліцензія на завантаження

lic = License()
lic.set_license(self.licPath)

Розпізнавайте текст на фотографіях

Читання тексту з будь-якого вмісту в Aspose.OCR для Python через .NET так само просто, як виклик універсального методу розпізнавання ().

Перетворення фотографії в текст - Python

api = AsposeOcr()
# Add image to the recognition batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("source1.png")

# Set recognition language
recognitionSettings = RecognitionSettings()
recognitionSettings.language = Language.UKR;

# Recognize the image
results = api.recognize(input, recognitionSettings)

# Print recognition result
for result in results:
print(result.recognition_text)

Універсальний конвертер Python

Наш API вміло зчитує будь-які зображення зі сканерів, камер або смартфонів: документи PDF, JPEG, PNG, TIFF, GIF, зображення BMP і навіть файли DjVu. Повна підтримка багатосторінкових PDF-документів, зображень TIFF і DjVu забезпечує універсальність. Ви також можете надати зображення з Інтернету через URL-адресу.

Результати розпізнавання повертаються в популярних форматах документів і обміну даними: простий текст, PDF, Microsoft Word, Microsoft Excel, JSON і XML.

Розпізнавання PDF і збереження результатів у різних вихідних форматах - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(aspose.ocr.models.InputType.PDF)
file = os.path.join(self.dataDir, "pdfs/multi_page_1.pdf")
input.add(file, 0, 3)

set = RecognitionSettings()
set.set_detect_areas_mode = DetectAreasMode.NONE
result = api.recognize(input, set)
api.save_multipage_document("test.xml", SaveFormat.XML, result)
api.save_multipage_document("test.json", SaveFormat.JSON, result)
api.save_multipage_document("test.pdf", SaveFormat.PDF, result)
api.save_multipage_document("test.xlsx", SaveFormat.XLSX, result)
api.save_multipage_document("test.docx", SaveFormat.DOCX, result)
api.save_multipage_document("test.txt", SaveFormat.TEXT, result)
api.save_multipage_document("test.html", SaveFormat.HTML, result)
api.save_multipage_document("test.epub", SaveFormat.EPUB, result)
api.save_multipage_document("test.rtf", SaveFormat.RTF, result)

Оптимізація ресурсів у Python

Оптичне розпізнавання символів вимагає ресурсів. Наш API пропонує гнучкі способи збалансувати класичну тріаду час-ціна-якість:

  • Вибирайте між ретельним розпізнаванням і швидким розпізнаванням.
  • Укажіть кількість потоків, призначених для розпізнавання, або дозвольте бібліотеці автоматично масштабуватись відповідно до кількості ядер процесора.
  • Звільніть центральний процесор, перевантаживши обчислення на серверну частину .NET.

Швидке розпізнавання - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

result = api.recognize_fast(input)

Розпізнати один рядок

Якщо ваше зображення вже обрізано до одного рядка тексту, його можна розпізнати в найшвидшому режимі без автоматичних виправлень, визначення структури вмісту та інших ресурсозатратних кроків. Він може пришвидшити OCR до 7 разів швидше, ніж звичайний процес розпізнавання.

Розпізнавати один рядок тексту на зображенні - Python

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)